從搜索引擎角度講搜索引擎優(yōu)化,互聯(lián)網(wǎng)中的頁面主要分為四種頁面,即已抓取網(wǎng)頁、待抓取網(wǎng)頁、可抓取網(wǎng)頁以及暗網(wǎng)。
網(wǎng)頁四大類型講解,熟悉網(wǎng)站頁面分類方式
顧名思義,已抓取網(wǎng)頁就是蜘蛛已經(jīng)抓取過的網(wǎng)站內(nèi)容, 待抓取就是未抓取但是已經(jīng)進入等待列表中,可抓取是還沒有發(fā)現(xiàn)但是已經(jīng)存在的頁面,暗網(wǎng)則是搜索引擎通過鏈接自我抓取無法找到需要手動提交才能發(fā)現(xiàn)的頁面。
平時我們所分析的頁面抓取主要是非暗網(wǎng)中的頁面抓取,暗網(wǎng)抓取每個搜索引擎都有其獨到的算法我們不做過多的剖析。
搜索引擎的抓取策略主要有兩種策略,即為廣度優(yōu)先策略和深度優(yōu)先策略。
廣告2022毒狗專屬傳奇,十倍爆率,百倍回收,散人輕松變壕!
×
廣度優(yōu)先策略講解
大多數(shù)網(wǎng)頁都會有除卻自身鏈接之外的很多鏈接,比如詳情頁有相關(guān)新聞、相關(guān)案例等鏈接,當搜索引擎訪問到一個頁面之后,它該頁面所有鏈接依次入庫排列,然后對發(fā)現(xiàn)的頁面進行遍歷抓取,再把最新發(fā)現(xiàn)的URL進行入庫排列等待抓取,按照這樣的邏輯依次進行抓取即為廣度優(yōu)先策略。如圖:抓取順序為1-2、3、4-5-11-6-12-3-7-13-8-14。結(jié)合圖文自我理解一下。
深度優(yōu)先策略講解
按照頁面的一條鏈接一層一層的進行抓取,直到抓取到最末端的鏈接后搜索引擎優(yōu)化,再返回初始位置按照同樣的方式進行抓取其余鏈接則為深度優(yōu)先策略。
不管是廣度優(yōu)先還是深度優(yōu)先兩種策略,只要有足夠的時間搜索引擎都能抓取全部的頁面,但是搜索引擎的抓取精力是優(yōu)先的,并不能保證頁面抓取的全面性,搜索引擎受到自身資源的限制不得不考慮抓取頁面優(yōu)先級的問題。也對應出現(xiàn)了另外兩種抓取策略。
廣告同學的媽媽,今年40歲依然風韻猶存,還是名大學生物老師
×
重要網(wǎng)頁優(yōu)先抓取策略
判斷頁面的重要性,搜索引擎主要從自身的質(zhì)量、權(quán)重來判斷另外還有一個比較重要的因素就是導入鏈接的多少,比如首頁的導入鏈接肯定是必起于頁面多的,因此首頁的優(yōu)先級也是比較高的。
大站鏈接優(yōu)先策略
大站優(yōu)先很明顯的就是搜索一群對大型網(wǎng)站有偏愛性,它自身的權(quán)重就是比較高的,這里的權(quán)重講的不單純是PR,而是信任度,并不是說人家實力大就是權(quán)重高搜索引擎就喜歡,很多B2B網(wǎng)站內(nèi)容量也是很龐大的,然而搜索引擎并不能很好的去爬取頁面內(nèi)容,相對來說一些較好的網(wǎng)站可以有著很好的活躍度,所以發(fā)新聞可以增加活躍度提高,發(fā)到大站首頁也可以實現(xiàn)秒收。
總而言之,搜索引擎的資源是有限的,在搜索引擎有限資源的情況下,我們應該盡可能的依靠外部鏈接來引導蜘蛛和提升網(wǎng)站權(quán)重,這才是網(wǎng)站SEO搜索引擎優(yōu)化長期運營的重中之重
*請認真填寫需求信息,我們會在24小時內(nèi)與您取得聯(lián)系。