來看下常用的標(biāo)簽列表,后文會(huì)一一介紹:
<!DOCTYPE html> <!-- 使用 HTML5 doctype,不區(qū)分大小寫 -->
<html lang="zh-cmn-Hans"> <!-- 更加標(biāo)準(zhǔn)的 lang 屬性寫法 http://zhi.hu/XyIa -->
<head>
<meta charset='utf-8'> <!-- 聲明文檔使用的字符編碼 -->
<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1" /> <!-- 優(yōu)先使用 IE 最新版本和 Chrome -->
<meta name="description" content="不超過150個(gè)字符" /> <!-- 頁面描述 -->
<meta name="keywords" content=""/> <!-- 頁面關(guān)鍵詞 -->
<meta name="author" content="name, email@gmail.com" /> <!-- 網(wǎng)頁作者 -->
<meta name="robots" content="index,follow" /> <!-- 搜索引擎抓取 -->
<!-- 為移動(dòng)設(shè)備添加 viewport -->
<meta name ="viewport" content ="initial-scale=1, maximum-scale=3, minimum-scale=1, user-scalable=no"> <!-- `width=device-width` 會(huì)導(dǎo)致 iPhone 5 添加到主屏后以 WebApp 全屏模式打開頁面時(shí)出現(xiàn)黑邊 http://bigc.at/ios-webapp-viewport-meta.orz -->
<!-- iOS 設(shè)備 begin -->
<meta name="apple-mobile-web-app-title" content="標(biāo)題"> <!-- 添加到主屏后的標(biāo)題(iOS 6 新增) -->
<meta name="apple-mobile-web-app-capable" content="yes" /> <!-- 是否啟用 WebApp 全屏模式 -->
<meta name="apple-mobile-web-app-status-bar-style" content="black-translucent" /> <!-- 設(shè)置狀態(tài)欄的背景顏色,只有在 `"apple-mobile-web-app-capable" content="yes"` 時(shí)生效 -->
<meta name="format-detection" content="telephone=no" /> <!-- 禁止數(shù)字識(shí)自動(dòng)別為電話號(hào)碼 -->
<meta name="apple-itunes-app" content="app-id=myAppStoreID, affiliate-data=myAffiliateData, app-argument=myURL"> <!-- 添加智能 App 廣告條 Smart App Banner(iOS 6+ Safari) -->
<!-- iOS 圖標(biāo) begin -->
<link rel="apple-touch-icon-precomposed" href="/apple-touch-icon-57x57-precomposed.png" /> <!-- iPhone 和 iTouch,默認(rèn) 57x57 像素,必須有 -->
<link rel="apple-touch-icon-precomposed" sizes="114x114" href="/apple-touch-icon-114x114-precomposed.png" /> <!-- Retina iPhone 和 Retina iTouch,114x114 像素,可以沒有,但推薦有 -->
<link rel="apple-touch-icon-precomposed" sizes="144x144" href="/apple-touch-icon-144x144-precomposed.png" /> <!-- Retina iPad,144x144 像素,可以沒有,但推薦有 -->
<!-- iOS 圖標(biāo) end -->
<!-- iOS 啟動(dòng)畫面 begin -->
<link rel="apple-touch-startup-image" sizes="768x1004" href="/splash-screen-768x1004.png" /> <!-- iPad 豎屏 768 x 1004(標(biāo)準(zhǔn)分辨率) -->
<link rel="apple-touch-startup-image" sizes="1536x2008" href="/splash-screen-1536x2008.png" /> <!-- iPad 豎屏 1536x2008(Retina) -->
<link rel="apple-touch-startup-image" sizes="1024x748" href="/Default-Portrait-1024x748.png" /> <!-- iPad 橫屏 1024x748(標(biāo)準(zhǔn)分辨率) -->
<link rel="apple-touch-startup-image" sizes="2048x1496" href="/splash-screen-2048x1496.png" /> <!-- iPad 橫屏 2048x1496(Retina) -->
<link rel="apple-touch-startup-image" href="/splash-screen-320x480.png" /> <!-- iPhone/iPod Touch 豎屏 320x480 (標(biāo)準(zhǔn)分辨率) -->
<link rel="apple-touch-startup-image" sizes="640x960" href="/splash-screen-640x960.png" /> <!-- iPhone/iPod Touch 豎屏 640x960 (Retina) -->
<link rel="apple-touch-startup-image" sizes="640x1136" href="/splash-screen-640x1136.png" /> <!-- iPhone 5/iPod Touch 5 豎屏 640x1136 (Retina) -->
<!-- iOS 啟動(dòng)畫面 end -->
<!-- iOS 設(shè)備 end -->
<meta name="msapplication-TileColor" content="#000"/> <!-- Windows 8 磁貼顏色 -->
<meta name="msapplication-TileImage" content="icon.png"/> <!-- Windows 8 磁貼圖標(biāo) -->
<link rel="alternate" type="application/rss+xml" title="RSS" href="/rss.xml" /> <!-- 添加 RSS 訂閱 -->
<link rel="shortcut icon" type="image/ico" href="/favicon.ico" /> <!-- 添加 favicon icon -->
<title>標(biāo)題</title>
</head>
基本標(biāo)簽
使用 HTML5 doctype,不區(qū)分大小寫。
<!DOCTYPE html> <!-- 使用 HTML5 doctype,不區(qū)分大小寫 -->
聲明文檔使用的字符編碼
<meta charset='utf-8'> <!-- 聲明文檔使用的字符編碼 -->
更加標(biāo)準(zhǔn)的 lang 屬性寫法 http://zhi.hu/XyIa
很少情況才需要加地區(qū)代碼,通常是為了強(qiáng)調(diào)不同地區(qū)漢語使用差異,例如:
<p lang="zh-cmn-Hans">
<strong lang="zh-cmn-Hans-CN">菠蘿</strong>和<strong lang="zh-cmn-Hant-TW">鳳梨</strong>其實(shí)是同一種水果。只是大陸和臺(tái)灣稱謂不同,且新加坡、馬來西亞一帶的稱謂也是不同的,稱之為<strong lang="zh-cmn-Hans-SG">黃梨</strong>。
</p>
優(yōu)先使用 IE 最新版本和 Chrome
<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1" /> <!-- 優(yōu)先使用 IE 最新版本和 Chrome -->
SEO 優(yōu)化
頁面描述
每個(gè)網(wǎng)頁都應(yīng)有一個(gè)不超過 150 個(gè)字符且能準(zhǔn)確反映網(wǎng)頁內(nèi)容的描述標(biāo)簽。文檔
<meta name="description" content="不超過150個(gè)字符" /> <!-- 頁面描述 -->
頁面關(guān)鍵詞
<meta name="keywords" content=""/> <!-- 頁面關(guān)鍵詞 -->
定義頁面標(biāo)題
<title>標(biāo)題</title>
定義網(wǎng)頁作者
<meta name="author" content="name, email@gmail.com" /> <!-- 網(wǎng)頁作者 -->
定義網(wǎng)頁搜索引擎索引方式,robotterms是一組使用英文逗號(hào)「,」分割的值,通常有如下幾種取值:none,noindex,nofollow,all,index和follow。文檔
<meta name="robots" content="index,follow" /> <!-- 搜索引擎抓取 -->
可選標(biāo)簽
為移動(dòng)設(shè)備添加 viewport
<meta name ="viewport" content ="initial-scale=1, maximum-scale=3, minimum-scale=1, user-scalable=no"> <!-- `width=device-width` 會(huì)導(dǎo)致 iPhone 5 添加到主屏后以 WebApp 全屏模式打開頁面時(shí)出現(xiàn)黑邊 http://bigc.at/ios-webapp-viewport-meta.orz -->
content 參數(shù):
iOS 設(shè)備
添加到主屏后的標(biāo)題(iOS 6 新增)
<meta name="apple-mobile-web-app-title" content="標(biāo)題"> <!-- 添加到主屏后的標(biāo)題(iOS 6 新增) -->
是否啟用 WebApp 全屏模式
<meta name="apple-mobile-web-app-capable" content="yes" /> <!-- 是否啟用 WebApp 全屏模式 -->
設(shè)置狀態(tài)欄的背景顏色
<meta name="apple-mobile-web-app-status-bar-style" content="black-translucent" /> <!-- 設(shè)置狀態(tài)欄的背景顏色,只有在 `"apple-mobile-web-app-capable" content="yes"` 時(shí)生效 -->
content 參數(shù):
如果設(shè)置為 default 或 black ,網(wǎng)頁內(nèi)容從狀態(tài)欄底部開始。
如果設(shè)置為 black-translucent ,網(wǎng)頁內(nèi)容充滿整個(gè)屏幕,頂部會(huì)被狀態(tài)欄遮擋。
禁止數(shù)字識(shí)自動(dòng)別為電話號(hào)碼
<meta name="format-detection" content="telephone=no" /> <!-- 禁止數(shù)字識(shí)自動(dòng)別為電話號(hào)碼 -->
iOS 圖標(biāo)
rel 參數(shù):
apple-touch-icon 圖片自動(dòng)處理成圓角和高光等效果。
apple-touch-icon-precomposed 禁止系統(tǒng)自動(dòng)添加效果,直接顯示設(shè)計(jì)原圖。
iPhone 和 iTouch,默認(rèn) 57x57 像素,必須有
<link rel="apple-touch-icon-precomposed" href="/apple-touch-icon-57x57-precomposed.png" /> <!-- iPhone 和 iTouch,默認(rèn) 57x57 像素,必須有 -->
iPad,72x72 像素,可以沒有,但推薦有
<link rel="apple-touch-icon-precomposed" sizes="72x72" href="/apple-touch-icon-72x72-precomposed.png" /> <!-- iPad,72x72 像素,可以沒有,但推薦有 -->
Retina iPhone 和 Retina iTouch,114x114 像素,可以沒有,但推薦有
<link rel="apple-touch-icon-precomposed" sizes="114x114" href="/apple-touch-icon-114x114-precomposed.png" /> <!-- Retina iPhone 和 Retina iTouch,114x114 像素,可以沒有,但推薦有 -->
Retina iPad,144x144 像素,可以沒有,但推薦有
<link rel="apple-touch-icon-precomposed" sizes="144x144" href="/apple-touch-icon-144x144-precomposed.png" /> <!-- Retina iPad,144x144 像素,可以沒有,但推薦有 -->
iOS 啟動(dòng)畫面
官方文檔:https://developer.apple.com/library/ios/qa/qa1686/_index.html
參考文章:http://wxd.ctrip.com/blog/2013/09/ios7-hig-24/
iPad 的啟動(dòng)畫面是不包括狀態(tài)欄區(qū)域的。
iPad 豎屏 768 x 1004(標(biāo)準(zhǔn)分辨率)
<link rel="apple-touch-startup-image" sizes="768x1004" href="/splash-screen-768x1004.png" /> <!-- iPad 豎屏 768 x 1004(標(biāo)準(zhǔn)分辨率) -->
iPad 豎屏 1536x2008(Retina)
<link rel="apple-touch-startup-image" sizes="1536x2008" href="/splash-screen-1536x2008.png" /> <!-- iPad 豎屏 1536x2008(Retina) -->
iPad 橫屏 1024x748(標(biāo)準(zhǔn)分辨率)
<link rel="apple-touch-startup-image" sizes="1024x748" href="/Default-Portrait-1024x748.png" /> <!-- iPad 橫屏 1024x748(標(biāo)準(zhǔn)分辨率) -->
iPad 橫屏 2048x1496(Retina)
<link rel="apple-touch-startup-image" sizes="2048x1496" href="/splash-screen-2048x1496.png" /> <!-- iPad 橫屏 2048x1496(Retina) -->
iPhone 和 iPod touch 的啟動(dòng)畫面是包含狀態(tài)欄區(qū)域的。
iPhone/iPod Touch 豎屏 320x480 (標(biāo)準(zhǔn)分辨率)
<link rel="apple-touch-startup-image" href="/splash-screen-320x480.png" /> <!-- iPhone/iPod Touch 豎屏 320x480 (標(biāo)準(zhǔn)分辨率) -->
iPhone/iPod Touch 豎屏 640x960 (Retina)
<link rel="apple-touch-startup-image" sizes="640x960" href="/splash-screen-640x960.png" /> <!-- iPhone/iPod Touch 豎屏 640x960 (Retina) -->
iPhone 5/iPod Touch 5 豎屏 640x1136 (Retina)
<link rel="apple-touch-startup-image" sizes="640x1136" href="/splash-screen-640x1136.png" /> <!-- iPhone 5/iPod Touch 5 豎屏 640x1136 (Retina) -->
添加智能 App 廣告條 Smart App Banner(iOS 6+ Safari)文檔
<meta name="apple-itunes-app" content="app-id=myAppStoreID, affiliate-data=myAffiliateData, app-argument=myURL"> <!-- 添加智能 App 廣告條 Smart App Banner(iOS 6+ Safari) -->
Android
Android Lollipop 中的 Chrome 39 增加 theme-color meta 標(biāo)簽,用來控制選項(xiàng)卡顏色。
http://updates.html5rocks.com/2014/11/Support-for-theme-color-in-Chrome-39-for-Android
<meta name="theme-color" content="#db5945">
Windows 8
Windows 8 磁貼顏色
<meta name="msapplication-TileColor" content="#000"/> <!-- Windows 8 磁貼顏色 -->
Windows 8 磁貼圖標(biāo)
<meta name="msapplication-TileImage" content="icon.png"/> <!-- Windows 8 磁貼圖標(biāo) -->
其他
添加 RSS 訂閱
<link rel="alternate" type="application/rss+xml" title="RSS" href="/rss.xml" /> <!-- 添加 RSS 訂閱 -->
添加 favicon icon
<link rel="shortcut icon" type="image/ico" href="/favicon.ico" /> <!-- 添加 favicon icon -->
禁止 Chrome 瀏覽器中自動(dòng)提示翻譯
高雙手?。?/span>!
作為一個(gè)在線設(shè)計(jì)平臺(tái),稿定設(shè)計(jì)實(shí)名自薦!
另外,稿叔也從俺家設(shè)計(jì)師們手上要來了超多高逼格素材網(wǎng)站,希望能幫到你們!
話不多說,先上個(gè)匯總圖:
1、FreePNGs——海量免費(fèi)PNG素材資源
FreePNGs有超過17w張免費(fèi)的 PNG 透明圖片可供下載,所有的圖像的都是可免費(fèi)下載使用的。
圖片分類豐富多樣,在這里你可以輕松找到你喜歡的人物、植物、建筑、交通工具等PNG圖片資源,是一個(gè)值得你收藏的 PNG 海量圖庫網(wǎng)站。
P.S.可供個(gè)人自由使用,但是商業(yè)用途可能需要注意
2、Pngtree——免費(fèi)PNG圖片資源平臺(tái)
Pngtree提供數(shù)百萬個(gè)PNG圖形資源可供所有人免費(fèi)下載,專業(yè)設(shè)計(jì)師都在用的圖片資源平臺(tái)!
它擁有豐富的免版稅 PNG 圖像、矢量圖、背景圖、模板、文本效果等圖形資源,只要注冊(cè)就可以獲得每天 2 次免費(fèi)下載的機(jī)會(huì)。
3、pngimg——海量 PNG 免摳圖素材庫
PngImg 是一個(gè)非營利性的 PNG 透明背景圖片素材庫,該網(wǎng)站提供了海量的高質(zhì)量 PNG 圖片,專門為設(shè)計(jì)師搜索和分享優(yōu)質(zhì)的無背景圖和剪貼畫,用戶無需注冊(cè)即可免費(fèi)下載使用!
4、Cleanpng——數(shù)百萬張PNG透明圖片素材資源庫
傳送門:https://www.cleanpng.com/
Cleanpng里擁有超過三百萬張 PNG 透明圖片素材,且每張PNG 圖片質(zhì)量都很高,如果你正在尋找最大最全的PNG 圖片資源,Cleanpng絕對(duì)不容錯(cuò)過!
這里的所有PNG 圖都可以免費(fèi)下載,下載數(shù)量不受限制,并且不需要注冊(cè)登錄就能直接下載!
5、Gratisography——高質(zhì)量攝影圖片集散地
Gratisography是一個(gè)提供免費(fèi)高品質(zhì)攝影圖片的集散地,優(yōu)勢(shì)在于所有的圖片都可以用于個(gè)人用途或商業(yè)用途!
每周都會(huì)更新免費(fèi)高清圖片資源,在這里有很多時(shí)尚流行的照片,只需點(diǎn)擊即可快速下載為你所用~
6、Unsplash——無版權(quán)高清圖片資源庫
Unsplash也是一款非常值得推薦和受歡迎的高清圖片庫,同樣擁有免費(fèi)、無版權(quán)的圖片資源,全都是由全世界的攝影師提供的精美照片供設(shè)計(jì)師下載、獲取靈感。
它的優(yōu)勢(shì)在于圖片分類廣,幾十種分類可以滿足各種圖片需求。
7、FOCA Stock——國外小眾免費(fèi)素材圖庫
FOCAStock是一個(gè)由熱愛攝影的小伙伴創(chuàng)建的免費(fèi)圖庫網(wǎng),照片風(fēng)格十分貼近我們的生活。
這里不止提供海量照片素材,還有視頻模板可供你下載,網(wǎng)站的照片分類十分齊全,包含了特色的照片自然、城市、日落、食物、風(fēng)景、城市場(chǎng)景,工作空間等分類,找到符合我們需求的圖片,不用注冊(cè)帳號(hào)就能直接下載!
8、稿定設(shè)計(jì)——在線設(shè)計(jì)神器&在線素材庫
對(duì)于沒有設(shè)計(jì)基礎(chǔ)或不會(huì)PS的菜鳥同學(xué)來說,稿定設(shè)計(jì)簡直太好用了!
涵蓋了新媒體配圖、電商、生活?yuàn)蕵贰⑥k公商務(wù)等上百種場(chǎng)景,20W+原創(chuàng)版權(quán)素材模板,
光是海報(bào)就有手機(jī)海報(bào)、動(dòng)態(tài)海報(bào)、長圖海報(bào)、電商橫版海報(bào)、廣告banner、全屏海報(bào)、張貼海報(bào)、營銷海報(bào)......超多不同類型的模板可供你挑選!
簡單拖拉拽,替換圖文內(nèi)容就能在線生成精美圖片,可以解決你生活工作所有作圖需求!
除此之外,稿定設(shè)計(jì)還是專門的設(shè)計(jì)素材庫,點(diǎn)擊左側(cè)工具欄的“設(shè)計(jì)素材”,就能進(jìn)入稿定素材站:
海量圖區(qū):優(yōu)質(zhì)圖片全球合作,版權(quán)來源清晰可溯,全類型覆蓋您的作圖需要。
平面模板:品質(zhì)模板源文件每日更新,圖層井然有序提高作圖效率從此不加班。
品質(zhì)視頻:持續(xù)更新的視頻素材,緊隨熱點(diǎn),助力視頻營銷,提升轉(zhuǎn)化效率。
高端免摳:高端原創(chuàng)免摳素材,源文件下載更靈活;本土化獨(dú)家設(shè)計(jì),為設(shè)計(jì)賦能。
150W+正版圖片素材、8000W+圖片資源、200正版字體,就在稿定素材!
9、WebGradients——漸變色在線工具
在WebGradients你可以輕松調(diào)出漂亮的漸變色~
它提供180 個(gè)線性漸變的搭配方式,可以將其用作網(wǎng)站任何部分的內(nèi)容背景。
亮點(diǎn)在于,它可輕松復(fù)制 CSS3 代碼,直接使用在作品中!并且免費(fèi)提供給商業(yè)或個(gè)人使用,說一句設(shè)計(jì)師的色彩百寶箱也不為過!
10、Culrs——設(shè)計(jì)師必備優(yōu)質(zhì)調(diào)色板
Culrs是一個(gè)專業(yè)的設(shè)計(jì)師在線調(diào)色板,免費(fèi)提供豐富的設(shè)計(jì)配色方案。有了它你不用再費(fèi)腦筋尋找合適的顏色組合,輕松得到專業(yè)的設(shè)計(jì)用色!
同時(shí)Culrs還提供超人性化配色分類,可以說是設(shè)計(jì)師配色必備收藏調(diào)色板!
11、ColorLeap——復(fù)古配色方案在線工具
ColorLeap有個(gè)別名叫色彩時(shí)光機(jī),它可以查詢每個(gè)年代輝煌的的流行配色
最早從公元前 2000 年開始一直到現(xiàn)代,都有相關(guān)的作品色彩記錄
可以幫助設(shè)計(jì)師獲取靈感,讓設(shè)計(jì)師盡情感受色彩的靈魂
12、Iconfinder——免費(fèi)圖標(biāo)網(wǎng)站
Iconfinder是一款超實(shí)用的免費(fèi)圖標(biāo)網(wǎng)站,為用戶提供海量免費(fèi)圖標(biāo)+矢量素材,在這里可以輕松找到各種設(shè)計(jì)配色的圖案。
對(duì)于設(shè)計(jì)師而言是一款非常值得收藏的免費(fèi)資源網(wǎng)站!
13、IconBlender——免費(fèi)網(wǎng)頁 SVG 圖標(biāo)素材庫
如果你在為找到的圖標(biāo)素材過大而煩惱,可以試試IconBlender!這里提供了 80000 多個(gè)免費(fèi)開源的圖標(biāo)資源可供你下載使用,也可以直接復(fù)制到網(wǎng)頁代碼使用。
使用過程可以選擇圖標(biāo)大小和粗細(xì),圖標(biāo)顏色,以及圖標(biāo)類型,簡直太友好了!
14、iconfont——阿里巴巴矢量圖標(biāo)庫
阿里巴巴旗下國內(nèi)功能最為強(qiáng)大且圖標(biāo)內(nèi)容很豐富的矢量圖標(biāo)庫之一,為用戶提供矢量圖標(biāo)下載、在線存儲(chǔ)、格式轉(zhuǎn)換等功能。
支持AI/SVG/PNG/代碼格式下載,并且支持按路徑在線編輯icon顏色,設(shè)計(jì)師人手必備的圖標(biāo)網(wǎng)站!
15、Skribbl——?jiǎng)?chuàng)意手繪插圖插畫站
手繪插圖是設(shè)計(jì)師管用的設(shè)計(jì)方式之一,如果你喜歡手繪插圖,或是想要分享自己的有意思的手繪作品,那么Skribbl就是一個(gè)不錯(cuò)的選擇!
這里提供了來自全球優(yōu)秀設(shè)計(jì)師分享的免費(fèi)手繪插圖,都是一些簡單的手繪插畫,但帶來的視覺沖擊力一點(diǎn)也不弱,想要獲取到免費(fèi)的插圖資源,可以訂閱,之后就能發(fā)送到你的郵箱!
16、50 Watts——插圖插畫視覺藝術(shù)站
50 Watts收集了來至世界各地怪異和讓人驚訝的視覺圖形,你看到的每一個(gè)素材,都能讓你記憶猶新。
這些創(chuàng)新是十足的設(shè)計(jì)手法,可以激發(fā)你的創(chuàng)作靈感。
17、Soazi Good——日本風(fēng)格插圖插畫素材站
與其他插畫素材站不同,Soazi Good是一個(gè)非常精致可愛的插圖素材網(wǎng)站,小小的配飾非常有創(chuàng)意!
提供了背景類、各種主題的小插圖,甚至是動(dòng)態(tài)圖,可以下載的格式有很多,比如 JPG、PNG、AI,部份圖文件也有提供 EPS 或 PSD 格式下載~
先匯總這么多,感興趣的小伙伴可以關(guān)注一波,之后還會(huì)再來更新!
信息爆炸的互聯(lián)網(wǎng)時(shí)代,網(wǎng)絡(luò)爬蟲如同一把神奇的鑰匙,幫助我們打開海量網(wǎng)頁內(nèi)容的大門。然而,在實(shí)際操作過程中,不規(guī)范的網(wǎng)頁格式、紛繁復(fù)雜的干擾元素,特別是那些占據(jù)屏幕空間、影響閱讀體驗(yàn)的廣告,往往成為獲取高質(zhì)量數(shù)據(jù)的一大阻礙。因此,一款專為網(wǎng)絡(luò)爬蟲設(shè)計(jì)的HTML廣告移除神器顯得尤為重要。這款工具利用強(qiáng)大的HtmlAgilityPack庫,能夠迅速而精準(zhǔn)地識(shí)別并剔除帶有class='ad'屬性的廣告標(biāo)簽,讓抓取到的頁面內(nèi)容回歸其最純粹的本質(zhì)。
代碼執(zhí)行效果如圖:
調(diào)用代碼:
// 假設(shè)這是從某個(gè)網(wǎng)頁上抓取的包含廣告的“混亂”HTML文本
string clutteredHtml = @"<html><head><title>網(wǎng)頁標(biāo)題</title></head><body><div class='header'><h1>網(wǎng)站標(biāo)題</h1></div><div class='nav'><ul><li><a href='#'>首頁</a></li><li><a href='#'>關(guān)于我們</a></li><li><a href='#'>聯(lián)系我們</a></li></ul></div><div class='content'><p>正文內(nèi)容1...</p><p>正文內(nèi)容2...</p><p>正文內(nèi)容3...</p></div><div class='ad'>廣告1...</div><div class='ad'>廣告2...</div><div class='ad'>廣告3...</div><div class='footer'><p>© 2023 版權(quán)所有</p></div></body></html>";
// 使用廣告移除功能對(duì)抓取的“臟亂差”HTML進(jìn)行深度清理
string polishedHtml = ScrubAndRemoveAds(clutteredHtml);
// 廣告移除及HTML內(nèi)容凈化的具體實(shí)現(xiàn)方法
public static string ScrubAndRemoveAds(string messyHtmlContent)
{
// 創(chuàng)建一個(gè)可以解析和理解HTML結(jié)構(gòu)的對(duì)象,并載入抓取的HTML文本
var htmlParser = new HtmlDocument();
htmlParser.LoadHtml(messyHtmlContent);
// 掃描整個(gè)HTML文檔,找到所有標(biāo)記為廣告(class屬性值為"ad")的部分并刪除
foreach (var adElement in htmlParser.DocumentNode.SelectNodes("//div[@class='ad']"))
{
adElement.Remove(); // 刪除廣告區(qū)域
}
// 返回已經(jīng)清除廣告后的清爽HTML文本
return htmlParser.DocumentNode.OuterHtml;
}
這個(gè)代碼有效地解決了網(wǎng)絡(luò)爬蟲在抓取數(shù)據(jù)時(shí)遇到的廣告難題。無論對(duì)于追求極致閱讀體驗(yàn)的個(gè)人用戶,還是力求優(yōu)化數(shù)據(jù)質(zhì)量、節(jié)省資源成本的企業(yè)級(jí)用戶,這個(gè)小工具都展現(xiàn)出了卓越的價(jià)值。無需繁瑣的操作流程,一鍵即可輕松擺脫廣告干擾,讓你獲得高質(zhì)量、純凈的網(wǎng)頁內(nèi)容。無論是單獨(dú)處理單個(gè)網(wǎng)頁,還是批量清洗大量的抓取數(shù)據(jù),此工具都能得心應(yīng)手,為您提供高效便捷的網(wǎng)絡(luò)數(shù)據(jù)整理解決方案。朋友們,喜歡就拿去吧,別忘記關(guān)注我:代碼領(lǐng)域的詩人XY,我是一個(gè)樂于分享的人。樂于將自己的知識(shí)和經(jīng)驗(yàn)分享給朋友們,幫助你們解決問題,啟發(fā)你們的思考。我相信,只有通過分享和交流,我們才能不斷進(jìn)步,才能不斷創(chuàng)新。
*請(qǐng)認(rèn)真填寫需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。