前言: 這是白楊SEO公眾號原創(chuàng)第 220 篇。經(jīng)常有朋友在我的SEO付費(fèi)交流群或者私下說,網(wǎng)站收錄怎么又下降了,百度好像抓取出問題了,原因是什么怎么辦,所以今天就來分享下哈。
大綱如下:
1、抓取異常是什么?百度抓取異常又是什么?
2、百度抓取異常的原因有哪些?
3、網(wǎng)站抓取異常的原因有哪些?
4、百度抓取異常對網(wǎng)站有什么影響?
5、網(wǎng)站出現(xiàn)抓取異常的解決方法
抓取異常是什么?百度抓取異常又是什么?
所謂抓取異常,就是指搜索引擎蜘蛛無法抓取網(wǎng)站頁面,網(wǎng)站出現(xiàn)的抓取異常就是抓取異常,具體原因是什么下面會講到。
百度抓取異常是什么?簡單理解就是百度的蜘蛛(baiduspider)無法正常抓取,就是百度抓取異常。如上圖,來源網(wǎng)上。9月3號,百度蜘蛛來抓取時(shí),抓取時(shí)連接超時(shí)2次。
百度抓取異常的原因有哪些?
百度抓取異常的原原因主要分兩大類,一是網(wǎng)站異常,二是鏈接異常。在哪里看呢,在百度搜索資源平臺
網(wǎng)站異常原因:
1、dns異常
當(dāng)百度蜘蛛(Baiduspider)無法解析您網(wǎng)站的IP時(shí),會出現(xiàn)DNS異常??赡苁悄?網(wǎng)站IP地址錯(cuò)誤 ,或者 域名服務(wù)商把Baiduspider封禁了 。
可以用WHOIS或者h(yuǎn)ost查詢自己網(wǎng)站IP地址是否正確而且可以解析,如果不正確或無法解析,與域名注冊商聯(lián)系,更新網(wǎng)站IP地址。
2、連接超時(shí)
抓取請求連接超時(shí),可能原因是: 服務(wù)器過載 或 網(wǎng)絡(luò)不穩(wěn)定。
3、抓取超時(shí)
抓取請求連接建立后,下載頁面速度 過慢 ,導(dǎo)致超時(shí)??赡茉蚍?wù)器過載, 帶寬不足 。
4、連接錯(cuò)誤
無法連接或者連接建立后對方服務(wù)器拒絕。
鏈接異常原因:
1、訪問被拒絕
爬蟲發(fā)起抓取,httpcode返回碼是403。
2、找不到頁面
爬蟲發(fā)起抓取,httpcode返回碼是404。
3、服務(wù)器錯(cuò)誤
爬蟲發(fā)起抓取,httpcode返回碼是5XX
4、其他錯(cuò)誤
爬蟲發(fā)起抓取,httpcode返回碼是4XX,不包括403和404。
關(guān)于上面提到的403、404、4XX、5XX等,其實(shí)都是網(wǎng)站HTTP狀態(tài)碼,如果不清楚同學(xué),可以看這一篇: 白楊SEO:SEO入門學(xué)習(xí)之搜索引擎(百度)蜘蛛與網(wǎng)站HTTP狀態(tài)碼 ,再學(xué)習(xí)一下。
網(wǎng)站抓取異常的原因有哪些?
網(wǎng)站抓取異常的原因主要有以下五個(gè)方面:
1、服務(wù)器異常
服務(wù)器連接異常最大的可能是網(wǎng)站服務(wù)器過大,超負(fù)荷運(yùn)轉(zhuǎn),通過檢查瀏覽器輸入你的域名是否正常訪問。服務(wù)器異常會導(dǎo)致蜘蛛無法連接網(wǎng)站服務(wù)器,導(dǎo)致出現(xiàn)抓取失敗。
2、域名過期
域名過期網(wǎng)站肯定不能訪問,域名解析就會失效了。如果存在這類情況,你可以與你域名注冊商聯(lián)系解決,看是否被搶注,還是可以續(xù)費(fèi)回來。
3、網(wǎng)絡(luò)運(yùn)營商異常
電信和聯(lián)通這兩種都是屬于網(wǎng)絡(luò)運(yùn)營商,蜘蛛無法訪問的網(wǎng)站。
如果是因?yàn)殡娦呕蚵?lián)通網(wǎng)絡(luò)運(yùn)營商出現(xiàn)問題,與網(wǎng)絡(luò)服務(wù)運(yùn)營商聯(lián)系或者購買CDN服務(wù)。
3、robots.txt文件設(shè)置問題
robots.txt的功效主要是一些不重要的文件屏蔽掉告訴搜索引擎這些些頁面可以不抓取,但也可能會存在把重要的頁面也給屏蔽了,可以檢查下robots文件設(shè)置。
關(guān)于ROBOTS.TXT,可以看我之前寫的這篇里面有寫到:
白楊SEO:新人學(xué)習(xí)SEO常遇到的15個(gè)SEO術(shù)語,建議收藏
4、死鏈接因素
原本正常的鏈接后來失效了就是死鏈接,死鏈接發(fā)送請求時(shí),服務(wù)器返回404錯(cuò)誤頁面。 死鏈的處理方案可以通過百度站長平臺提交死鏈文件。
5、網(wǎng)站被掛馬
網(wǎng)站被掛馬,要查詢掛馬文件在哪里并刪除?;謴?fù)網(wǎng)站,更改登錄名和密碼,安全密保要從新設(shè)置,防止下次被掛馬。如果找不到,建議直接更換整個(gè)建站程序,換一個(gè)程序。
百度抓取異常對網(wǎng)站有什么影響?
如果網(wǎng)站上存在大量內(nèi)容蜘蛛無法正常抓取,百度搜索引擎會認(rèn)為網(wǎng)站給用戶的體驗(yàn)上有缺陷( 訪問網(wǎng)站的用戶沒有得到想要的東西,用戶的體驗(yàn)感就會下降 )降低對網(wǎng)站的評價(jià)。
而且,網(wǎng)站在 抓取、索引、權(quán)重 上都會受到一定程度的負(fù)面影響,更嚴(yán)重的會直接影響到網(wǎng)站從百度獲取的流量。 所以,百度網(wǎng)站抓取異常是非常嚴(yán)重的,一旦發(fā)現(xiàn),盡量解決。
如何解決呢,繼續(xù)往下看。
網(wǎng)站出現(xiàn)抓取異常的解決方法
1、出現(xiàn)5XX類型錯(cuò)誤情況
出現(xiàn)這些情況,并不是網(wǎng)站本身向搜索引擎說自己5XX問題,有時(shí)打開還是正常的,那么站長后臺的為什么會顯示這個(gè)錯(cuò)誤呢?
如果出現(xiàn)此類問題百分百是因?yàn)槟愕木W(wǎng)站服務(wù)器造成,而對于某一個(gè)狀態(tài)碼的含義,比如503,直接交給技術(shù)來進(jìn)行解決。如果技術(shù)還是解決不了,那么建議更換一家服務(wù)器。
2、抓取出現(xiàn)DNS錯(cuò)誤情況
很多SEO新人發(fā)現(xiàn)網(wǎng)站打不開了就會馬上找網(wǎng)站服務(wù)商,但是吧,域名DNS服務(wù)器有可能也會出現(xiàn)問題。當(dāng)網(wǎng)站出現(xiàn)問題后,比如打不開,第一時(shí)間應(yīng)當(dāng)確定到底是什么問題?
如果是域名的DNS問題,那么白楊SEO建議更換DSN。因?yàn)橛行〥SN出現(xiàn)了這個(gè)問題,它后面還有可能出現(xiàn)。如果要換,就要換大一點(diǎn)的DNS服務(wù)商,比如阿里云收購的萬網(wǎng)就不錯(cuò),畢竟大公司,穩(wěn)定性還可以的。
3、出現(xiàn)抓取超時(shí)問題
現(xiàn)在做SEO排名已經(jīng)到了用戶為王時(shí)代,用戶如果不能在第一時(shí)間打開你網(wǎng)站的頁面,那么就會跳到其他網(wǎng)站上去。而搜索引擎蜘蛛呢,一樣的。如果無法第一時(shí)間抓取,就會出現(xiàn)抓取超時(shí)問題。
上面說過,這個(gè)抓取超時(shí),大多都是因?yàn)閹挷蛔?,或者是網(wǎng)站頁面太大而引發(fā)的所以解決方法建議如下:
(1)、在不影響圖片質(zhì)量的情況下,對大的圖片進(jìn)行壓縮哈;
(2)、減少比如網(wǎng)站的JS腳本文件類型的使用,或者把一些JS進(jìn)行合并;跟技術(shù)說清楚。
(3)、整個(gè)網(wǎng)站頁面長度進(jìn)行控制,尤其是你的網(wǎng)站首頁。很多人網(wǎng)站首頁做了十來屏,一般用戶最多下拉三到五屏。越長,整個(gè)加載就會越久。
(4)、網(wǎng)頁的內(nèi)鏈數(shù)量,一般一個(gè)頁面互相之間的內(nèi)鏈數(shù)量建議不要超過500條哦,其實(shí)越多,蜘蛛都會去往下爬取,小網(wǎng)站基本沒這個(gè)問題。
總之,百度抓取網(wǎng)站異常這個(gè)問題,建議建站時(shí)找成熟的程序建站,同時(shí),找像阿里云這樣的大的服務(wù)商。不要總想著省錢,淘寶隨便幾百建個(gè)站,找個(gè)不知名服務(wù)商,其實(shí)這樣得不嘗失的。
我們專注高端建站,小程序開發(fā)、軟件系統(tǒng)定制開發(fā)、BUG修復(fù)、物聯(lián)網(wǎng)開發(fā)、各類API接口對接開發(fā)等。十余年開發(fā)經(jīng)驗(yàn),每一個(gè)項(xiàng)目承諾做到滿意為止,多一次對比,一定讓您多一份收獲!