一、 分析網(wǎng)站日志,看是否有被蜘蛛爬過(guò)
作為站長(zhǎng)一定要學(xué)會(huì)網(wǎng)站日志的分析,網(wǎng)站日志里面可以告訴我們表面看不到的隱藏問(wèn)題。
1)、如果未被收錄的頁(yè)面未被蜘蛛爬行
頁(yè)面沒(méi)有被Baiduspider爬行,那么你可以適當(dāng)?shù)慕o該頁(yè)面做一些外鏈來(lái)引導(dǎo)蜘蛛過(guò)來(lái)爬行,也可以給搜索引擎提交該頁(yè)面。
2)、如果頁(yè)面已經(jīng)被Baiduspider爬行過(guò)了
頁(yè)面被爬行也沒(méi)被收錄,那么就可能存在的因素:
1、 第一次被Baiduspider爬行,從百度的綜合算法來(lái)看該頁(yè)面的價(jià)值性極低,再考核要不要?jiǎng)?chuàng)建索引。
2、 第二次被Baiduspider爬行,該頁(yè)面從始至終都未有任何的變動(dòng),決定對(duì)此頁(yè)面暫停分析。
3、 第三次被Baiduspider爬行,該頁(yè)面還是沒(méi)變動(dòng),并且這么長(zhǎng)時(shí)間也未出現(xiàn)其它的附加價(jià)值(附加價(jià)值:評(píng)論,分享,被轉(zhuǎn)發(fā)等等),決定不予收錄。
要知道Baiduspider也是很忙的,沒(méi)有那么多的閑工夫天天來(lái)爬行你這些未收錄的頁(yè)面,所以,當(dāng)出現(xiàn)頁(yè)面長(zhǎng)時(shí)間都不被百度收錄的話,那么就要適當(dāng)?shù)慕o該頁(yè)面增加一些附加價(jià)值或者對(duì)該頁(yè)面進(jìn)行重新的進(jìn)行修改。你可以對(duì)文本新增一些圖片,視頻或者內(nèi)容,也可以對(duì)標(biāo)題進(jìn)行再次編輯。總之,要讓Baiduspider再次過(guò)來(lái)爬行的時(shí)候,返回的狀態(tài)碼不是一個(gè)無(wú)變化的狀態(tài),這樣你的頁(yè)面被收錄的幾率就大大的提升了。
第二、 是否robots設(shè)置錯(cuò)誤,主動(dòng)屏蔽Baiduspider
Robots的設(shè)置也是非常重要的,這個(gè)很多人可能對(duì)這些還不了解。建議大家可以到百度站長(zhǎng)工具資訊里面看,那里面有詳細(xì)的教程。若是自己robots設(shè)置的問(wèn)題,那么自己進(jìn)行糾正后,再在百度站長(zhǎng)工具后臺(tái)里面進(jìn)行更新robots這樣的話好讓百度蜘蛛重新更改狀態(tài)。
第三、 網(wǎng)站頁(yè)面是否存在敏感詞
如今越來(lái)越多的詞對(duì)搜索引擎來(lái)說(shuō)都有一定的敏感,敏感詞很有可能造成你的頁(yè)面不被收錄,有時(shí)候也會(huì)造成網(wǎng)站被將去或被k。所以站長(zhǎng)們?cè)俳ㄔO(shè)內(nèi)容的時(shí)候一定要注意不要在文中出現(xiàn)敏感詞。
第四、 你的頁(yè)面內(nèi)容是否是采集的
百度老大之前有表明過(guò),數(shù)據(jù)庫(kù)里面肯定會(huì)存在完完全全的重復(fù)的內(nèi)容。但是也會(huì)有一定的限制。比如一篇文章上限被收錄20篇,那么當(dāng)已經(jīng)被收錄20篇了,那么無(wú)論是你還是他人在轉(zhuǎn)載更新的話也不會(huì)被收錄。