在做SEO的過(guò)程中,我們總是會(huì)遇到各種莫名其妙的問(wèn)題,比如:某一天你的網(wǎng)站突然出現(xiàn)收錄緩慢的問(wèn)題,而平時(shí)都是秒收錄。
最開(kāi)始我們?cè)谧鰧彶榈臅r(shí)候,總是思考:
①是否搜索引擎算法在調(diào)整。
②是否自己的內(nèi)容質(zhì)量不高。
③是否是普遍大眾的情況。
但很少有SEO從業(yè)者,嘗試去查看網(wǎng)站日志的相關(guān)情況。
那么,SEO排名優(yōu)化,為什么要?慈罩?
根據(jù)以往SEO網(wǎng)站診斷的經(jīng)驗(yàn),斌網(wǎng)網(wǎng)絡(luò)網(wǎng)爺,將通過(guò)如下內(nèi)容闡述:
1、垃圾爬蟲(chóng)
如果你的網(wǎng)站運(yùn)營(yíng)一段時(shí)間,在谷歌和百度的收錄情況還比較好,并且具備一定的流量與權(quán)重,這個(gè)時(shí)候就可能存在“垃圾爬蟲(chóng)”廣泛爬取的情況。
通常這類(lèi)爬蟲(chóng)主要分為如下幾種類(lèi)型:
①?lài)?guó)外的一批SEO推廣軟件的搜索爬蟲(chóng),主要用于提取網(wǎng)站的鏈接狀態(tài)。
②網(wǎng)站鏡像的代理爬蟲(chóng),通常都會(huì)進(jìn)行偽裝。
③極個(gè)別的數(shù)據(jù)分析爬蟲(chóng)。(網(wǎng)站比較優(yōu)秀,SEO研究者對(duì)你的分析)
這些爬蟲(chóng)除了鏡像,實(shí)際上并沒(méi)有從SEO的角度給我們帶來(lái)諸多問(wèn)題,但是它卻非常容易占用大量的服務(wù)器資源,特別是如果你還是一個(gè)非知名主機(jī)商的虛擬主機(jī)。
如果你想要快速檢索你的站點(diǎn)爬蟲(chóng)數(shù)量,我們可以通過(guò)一個(gè)小策略,查看robots.txt文件的訪(fǎng)問(wèn)情況,這只是一個(gè)小技巧。
2、站內(nèi)搜索
我相信從目前來(lái)看,基本上除了單頁(yè)組合頁(yè)面之外,都會(huì)存在站內(nèi)搜索框這個(gè)功能,畢竟大量的CMS系統(tǒng)都會(huì)配置這個(gè)功能,特別是一些模板建站的企業(yè)網(wǎng)站。
在很長(zhǎng)一段時(shí)間里,我們?cè)缜敖o大家解讀過(guò)一個(gè)偏灰帽的策略,雖然是老套路,而不經(jīng)常被提及,但還是仍然有人沿用至今,簡(jiǎn)要流程如下:
①尋找具備搜索框的高權(quán)重網(wǎng)站。
②在高權(quán)重網(wǎng)站搜索框中,輸入一段超鏈接代碼。
③基于一些搜索框的設(shè)計(jì)策略,部分的搜索結(jié)果頁(yè)面會(huì)直接反饋出具有錨文本鏈接的外鏈。
這樣一些習(xí)慣性利用系統(tǒng)漏洞的灰帽,就會(huì)這樣無(wú)形之中建立一個(gè)高權(quán)重的外鏈。
而之后,便有了多個(gè)類(lèi)似于該策略的變體版本,比如:在搜索框中輸入第三方網(wǎng)址等等。
實(shí)際上,這個(gè)問(wèn)題,如果你不去查看日志,是很難發(fā)現(xiàn)的,但由于對(duì)方操作的策略,都是利用軟件自動(dòng)檢索,這會(huì)直接影響網(wǎng)站加載速度。
因此,從SEO角度來(lái)講,我們第一時(shí)間就應(yīng)該在robots.txt中屏蔽搜索結(jié)果頁(yè)面。
而后,從網(wǎng)站運(yùn)營(yíng)來(lái)講,不是特別必須,我們可以采用第三方搜索框,比如:百度站內(nèi)搜索。
3、漏洞掃描
網(wǎng)站安全漏洞掃描,這個(gè)是對(duì)于任何一個(gè)網(wǎng)站都可能會(huì)遇到的事情,比如:我們經(jīng)常可以在自己的站點(diǎn)數(shù)據(jù)中,看到大量的404頁(yè)面的訪(fǎng)問(wèn)情況。
它可能會(huì)出現(xiàn)各種CMS系統(tǒng)后臺(tái)的登錄地址,以及一些容易出現(xiàn)漏洞的文件,通常這些情況都是基礎(chǔ)性的漏洞掃描。
如果出現(xiàn)長(zhǎng)期這樣的問(wèn)題,并且IP地址固定的話(huà),我們可以進(jìn)行有效的攔截,同時(shí),基于SEO的角度,我們還是建議大家建立404頁(yè)面。
4、惡意采集
對(duì)于惡意采集而言,如果我們不去刻意的分析,我們是很難發(fā)現(xiàn)這個(gè)問(wèn)題,除非你在百度搜索結(jié)果中看到大量的整站內(nèi)容和你一樣的站點(diǎn)。
一般來(lái)講,我們?cè)诓榭慈罩镜臅r(shí)候,總是會(huì)調(diào)用一下IP訪(fǎng)問(wèn)的排行榜,你會(huì)發(fā)現(xiàn)某些特定的IP長(zhǎng)時(shí)間的停留在你的網(wǎng)站,并且大量的訪(fǎng)問(wèn)你的頁(yè)面。
這個(gè)時(shí)候我們需要排除它是不是CDN節(jié)點(diǎn),是不是正規(guī)的搜索引擎爬蟲(chóng),如果都不是,它很可能就是惡意采集或者鏡像的IP。
5、基礎(chǔ)狀態(tài)
審查日志相關(guān)性的數(shù)據(jù)判斷網(wǎng)站日常運(yùn)營(yíng)的基礎(chǔ)狀態(tài),這已經(jīng)是一個(gè)常態(tài)的操作策略,但對(duì)于新手站長(zhǎng)而言,經(jīng)常會(huì)忽略這個(gè)問(wèn)題,比如:
①HTTPS和HTTP不進(jìn)行301重定向,二者反饋都是200狀態(tài)。
②大量的站內(nèi)404頁(yè)面訪(fǎng)問(wèn),沒(méi)有進(jìn)行死鏈接提交等。
③我們是否需要針對(duì)一些304狀態(tài)的反饋,進(jìn)行改變。
④當(dāng)你遭遇一些服務(wù)器500錯(cuò)誤的時(shí)候,該如何處理的問(wèn)題。
6、站內(nèi)情況
有的時(shí)候我們?cè)谧鯯EO的過(guò)程中,偶爾需要進(jìn)行網(wǎng)站改版,也偶爾會(huì)遇到服務(wù)器升級(jí)的情況,如果自己的相關(guān)性配置不到位經(jīng)常會(huì)遭遇一些非常隱晦的問(wèn)題,比如:頁(yè)面重復(fù)性的問(wèn)題。
有的時(shí)候,我們?cè)谂渲镁W(wǎng)站偽靜態(tài)的時(shí)候,一些偽靜態(tài)規(guī)則,經(jīng)常會(huì)給出多個(gè)版本的策略,而只是讓我們?cè)谙到y(tǒng)后臺(tái)篩選。
但并沒(méi)有在選定之后,而對(duì)其他的鏈接展現(xiàn)形式進(jìn)行301重定向到目標(biāo)選定的URL形態(tài)上,這無(wú)形之中就會(huì)增加同內(nèi)容,多個(gè)偽靜態(tài)規(guī)則不同URL地址收錄的情況。
一般日常運(yùn)營(yíng)的過(guò)程中,我們是很難發(fā)現(xiàn)這個(gè)問(wèn)題的,除非你在site的時(shí)候,或者檢索標(biāo)題的時(shí)候,出現(xiàn)多個(gè)結(jié)果的時(shí)候才會(huì)注意。
這里給大家的建議就是:當(dāng)你遇到這個(gè)情況的時(shí)候,一定在配置文件中刪除沒(méi)有選定的偽靜態(tài)規(guī)則,以免造成不必要的麻煩。