搜索引擎抓取、索引、排名原理|長沙做網(wǎng)站_長沙做小程序_長沙做小程序的公司_長沙斌網(wǎng)網(wǎng)絡

搜索引擎抓取、索引、排名原理

信息來源：長沙做網(wǎng)站發(fā)布時間：2015-5-28 瀏覽：

一、索引：在談這個過程前，我們首先要理清搜索引擎索引數(shù)據(jù)表與信息數(shù)據(jù)表之間的關系，其實搜索引擎底層的數(shù)據(jù)存儲本身就是一個關系數(shù)據(jù)庫，索引數(shù)據(jù)表和信息數(shù)據(jù)表是兩個獨立的表，只是索引數(shù)據(jù)表和信息數(shù)據(jù)表是一對多的關系，這樣或許更好理解。那么搜索引擎為什么需要索引數(shù)據(jù)表呢？我們不妨從信息量這個角度分析一下，就目前來看，搜索引擎的信息量在百億級，而用戶搜索某個關鍵字時響應速度在短短的2、3秒內，在這短短的2、3內不僅僅要完成數(shù)據(jù)的查詢，而且還要完成數(shù)據(jù)的排序（關鍵詞排名）。如果每次都要從這百億級的數(shù)據(jù)中查詢用戶請求并處理排序，不僅減慢響應速度，而且還浪費了大量的計算資源，對服務器的壓力也會更大。這個時候，搜索引擎就迫切希望將用戶查詢的信息鎖定在一個范圍，這個范圍的信息量或許只有幾千條、幾百條，計算處理起來，效率要高很多，而索引數(shù)據(jù)表就是為解決這一問題出現(xiàn)的。

根據(jù)統(tǒng)計，漢語詞語大約有9萬多個，聽起來很龐大，但對于計算機來講處理起來恐怕會很輕松，而中文用戶的搜索無外乎就是這幾萬個詞語的組合（英文就更簡單了，26個字母的組合）。如果用戶搜索的是一連串兒的句子，那么要先經(jīng)過搜索引擎的分詞處理，比如搜索：華普筆記本電腦，分詞技術首先會按照漢語習慣進行劃分，劃分為：華普、筆記本、電腦，那么這三個常見詞語在搜索引擎索引數(shù)據(jù)庫表中都有對應的詞條，此時搜索引擎將從信息數(shù)據(jù)表中篩選出關聯(lián)索引數(shù)據(jù)表中3個詞語的全部詞條并取其交集詞條展現(xiàn)給用戶，如果用戶單一搜索一個詞語，那搜索引擎處理起來就更為簡單，直接從信息數(shù)據(jù)表中篩選出索引數(shù)據(jù)表中該詞所對應的詞條即可。

二、抓�。浩鋵嵲谧ト∏懊孢€有一個過程沒有描述在內，那就是爬行，也就是搜索引擎程序發(fā)現(xiàn)新網(wǎng)址的過程，只是這個過程大多伴隨著抓取，除非你的這個URL上的內容沒有什么價值（垃圾內容、重復內容、文字過少內容等）而被搜索引擎抓取程序直接跳過。搜索引擎爬行程序以數(shù)據(jù)表中已存在或新提交的鏈接順藤摸瓜式地進行爬行以不斷發(fā)現(xiàn)新的URL，抓取程序在分析并確定該URL的頁面內容有價值后，便將其整個頁面抓取下來放入到龐大的信息數(shù)據(jù)表中。新抓取的內容在進入信息數(shù)據(jù)表時，并不是一股腦地堆積在那，而是按照信息數(shù)據(jù)庫中表的字段（如：網(wǎng)頁URL、title、描述、正文內容、抓取時間、導出鏈接等）分門別類地將信息存儲起來，以便滿足后期的數(shù)據(jù)索引操作。

三、排名：闡述這一原理，不得不說下搜索引擎爬行、抓取過程，影響關鍵詞排名的因素很多，如：站內優(yōu)化情況、外鏈質量及數(shù)量、pr等，那么這些排名因素搜索引擎也必須抓入數(shù)據(jù)庫，納入數(shù)據(jù)表作為特定URL的排名依據(jù)，其實影響網(wǎng)頁排名指標的獲取過程就是搜索引擎爬行、抓取的過程。最難理解的可能就是外鏈這一塊兒，因為在抓取網(wǎng)頁時，搜索引擎是捕捉不到他的導入鏈接的，其實搜索引擎在抓取一個頁面時，已經(jīng)將該頁面的導出鏈接投票計算到了相應的頁面，并將這一有效投票寫入到了所指向的URL字段中（比如：votes字段），便于排名程序加以計算。當然，影響排名的因素很多，排名計算的具體方式我們也無從得知，因此這些不在我們的討論之列。關于排名，大家可能還有一個問題，就是每個詞語的排名是事先排序好了，還是當用戶搜索時才進行排序，筆者給出的答案是后者，或許這一個現(xiàn)象可以揭秘筆者的答案：每一天甚至每一小時關鍵字排名都會出現(xiàn)波動。

上一條：長沙做網(wǎng)站:網(wǎng)站流量迅速提升的方法
下一條：網(wǎng)站降權原因分析及解決辦法

網(wǎng)絡營銷
多年的網(wǎng)站建設經(jīng)驗，網(wǎng)至普不斷提升技術設計服務水平，迎合搜索引擎優(yōu)化規(guī)則

友情鏈接 / 同行鏈接QQ：522392221

返回頂部
0731-88571521
在線QQ
掃一掃進手機端

精品久久av,四虎影院在线观看免费,天天亚洲,欧美WW