第一:網(wǎng)站內(nèi)容重復(fù)的情況一般有哪些
網(wǎng)站重復(fù)內(nèi)容一般會(huì)有以下幾種情況:
1、同樣一篇文章出現(xiàn)多個(gè)URL,即使這篇文章屬于原創(chuàng),也會(huì)被百度給予懲罰
2、網(wǎng)站內(nèi)容多為采集,這種網(wǎng)站內(nèi)容重復(fù)會(huì)被當(dāng)做采集站直接被百度處理掉,百度新的綠蘿算法就是專(zhuān)門(mén)打擊采集站點(diǎn)的。
3、網(wǎng)站的固定版塊出現(xiàn)次數(shù)太多,很多網(wǎng)站的右側(cè)總是固定放一些版塊或欄目,這些欄目的內(nèi)容從來(lái)不進(jìn)行更新,或者各個(gè)頁(yè)面的右側(cè)都是前篇一律的內(nèi)容,就會(huì)造成頁(yè)面重復(fù)度高。
4、未設(shè)置404錯(cuò)誤頁(yè)面,當(dāng)我們刪除某一個(gè)頁(yè)面的時(shí)候,一定要用404狀態(tài)碼給予用戶和蜘蛛一定的提示,如果代碼設(shè)置錯(cuò)誤,那么刪除的頁(yè)面在蜘蛛那里是假想存在的,由此一來(lái)就會(huì)多次收錄。
5、動(dòng)態(tài)頁(yè)面和靜態(tài)并存,百度爬去目錄時(shí)收錄了大量動(dòng)態(tài)頁(yè)面
6、網(wǎng)站內(nèi)容以圖片為主,文字很少,很多圖片都是共用一個(gè)URL地址,這樣一來(lái)蜘蛛在索引的時(shí)候很難保證不被重復(fù)收錄。
第二:如何解決網(wǎng)站內(nèi)容重復(fù)的問(wèn)題
1、增加原創(chuàng)內(nèi)容,減少采集內(nèi)容
對(duì)于網(wǎng)站內(nèi)容多為采集或簡(jiǎn)單偽原創(chuàng)的網(wǎng)站,筆者建議增加原創(chuàng)文章的內(nèi)容,寧可百度收錄少一些,也不要讓百度把之前收錄的文章吐出來(lái)。
2、采集內(nèi)容,也有進(jìn)行低度的偽原創(chuàng)
這一點(diǎn)相信大家都用過(guò),把別人的文章搬過(guò)來(lái)稍加改動(dòng),蜘蛛最厭煩這樣的文章了。
3、每一個(gè)頁(yè)面都配上獨(dú)立的標(biāo)題
為每一個(gè)頁(yè)面都配上獨(dú)立的標(biāo)題,尤其是頻道頁(yè),這樣可以讓蜘蛛在檢索的時(shí)候注意到它的獨(dú)有性,從而得到更好地權(quán)重分配和優(yōu)化優(yōu)勢(shì)。
4、網(wǎng)站固定欄目?jī)?nèi)容隨機(jī)展示
可以根據(jù)正文的關(guān)鍵詞,隨機(jī)調(diào)用右側(cè)欄目的文章內(nèi)容,讓每一個(gè)頁(yè)面都有不一樣的內(nèi)容,避免大量頁(yè)面相似度高的情況出現(xiàn)。
5、減少多重URL
也許你的程序即可實(shí)現(xiàn)動(dòng)態(tài)也可實(shí)現(xiàn)靜態(tài),或者之前是靜態(tài)現(xiàn)在變?yōu)閯?dòng)態(tài)等情況,出現(xiàn)一個(gè)網(wǎng)頁(yè)有多個(gè)URL。兩種都是指同一個(gè)網(wǎng)頁(yè),但卻被搜索引擎以不同的URL抓取,這種情況我們盡量使用一種URL格式。
6、修改meta標(biāo)簽
一個(gè)好的描述對(duì)于蜘蛛的收錄判斷起著重大的影響作用,但是現(xiàn)在很多站點(diǎn)采用的都是CMS程序,無(wú)論大規(guī)模的實(shí)現(xiàn)meta標(biāo)簽獨(dú)立化,所以我個(gè)人建議大家手動(dòng)修改一部分meta標(biāo)簽。
7、修改CSS樣式表
很多新手站長(zhǎng)為了減少自己建設(shè)網(wǎng)站的難度,有時(shí)候就會(huì)去下載別人的網(wǎng)站主頁(yè)或是內(nèi)容頁(yè),然后稍微修改一下就放到自己的網(wǎng)站中了,但是新手站長(zhǎng)不要忘了,下載下來(lái)的樣本頁(yè)中有很多相似的CSS樣式表,如果不加修改必然會(huì)讓網(wǎng)站重復(fù)度升高。當(dāng)然能自己做就自己坐,保持特色是王道。
8、設(shè)置404頁(yè)面
設(shè)置404頁(yè)面可以告知用戶和搜索引擎某些頁(yè)面不存在了,防止搜索引擎收錄大量死鏈。
9、減少無(wú)效內(nèi)容之間的鏈接
很多時(shí)候我們會(huì)對(duì)之前的網(wǎng)站結(jié)構(gòu)或是內(nèi)容頁(yè)進(jìn)行修改,而那些被刪除的頁(yè)面一定要用管理員工具,以免蜘蛛重復(fù)抓取,謹(jǐn)防形成類(lèi)似于狀態(tài)碼200的情況。