從搜尋引擎工作原理折射出的SEO知識 中

2022-09-10 18:18:09 字數 1848 閱讀 8073

在前面一篇文章裡(搜尋引擎工作原理折射seo知識上)有說到搜尋引擎的工作原理的前部分也就是如何通過蛛蛛來抓取網路資訊的問題。從中我們也了解到,蛛蛛的一些習性與seo的一些操作小技巧。在今天的文章中我們會看到更多的有關於搜尋引擎的內容,好了廢話就不多說了。

我們都知道蛛蛛它畢竟還只是個程式而已,他做的工作不會通過**的前台來分析乙個**內容,而是通過**的**來進行抓取資訊的。而在**的源**裡我們會看到好多html、js等一些程式的語句。而蛛蛛他只會對裡面的文章感興趣,也就是說他只提取網頁裡的一些文字。

有些朋友可能就會說到了,那我們還寫什麼**?**不是起不到作用了嗎?

其實不是這樣的,在**的標籤優化中我們都知道比如h標籤、nofollow標籤、alt標籤等。這些標籤還是能在蛛蛛抓取我們**資訊的時候起到強調與修飾作用。比如遇到**的時候,但蛛蛛並不能識別**裡的資訊,那麼我們就會考慮去設定一下alt標籤來幫助搜尋引擎來識別**裡的資訊;為了讓**的一些權重不分散,我們在必要地方給鏈結加上了nofollow。

既然搜尋引擎蛛蛛是對**文字特別感興趣,那對於中文seo優化來說。是不是會有個概念性的東西在這裡面,那就是「分詞」

最簡單的乙個例子,比如我們中文裡面的「**優化」這四個詞,在百度搜尋引擎資料詞庫里,其實是把**與優化兩個不同的詞分開來存放的。當使用者來搜尋**優化這個詞的時候,搜尋引擎的步驟也就是把**這個詞庫里的網頁資訊與優化詞庫里的資訊做乙個交集來檢索與排名。這點後面還會有說到。

在說到分詞的時候我們不得不提乙個東西,那就是我們如何來看**乙個分詞情況:在百度搜尋引擎裡面搜尋「寧波何濤seo」在出面的搜尋結果裡面,我們看下**的那個快照如圖

我們是不是很容易的看到在快照裡的顯示結果百度把這個詞分成了三塊不同背景色的片語。這個只是其一,我們也可以在百度的搜尋結果裡看到只要是我們搜尋的詞,都會有標紅的情況。這個也是分詞的另一種表現形式。

有些朋友可能會說了,你說的那些是個別情況,我們在現實過程去搜尋的詞遠遠比這個複雜,而且可能還會有一些語氣助詞等。做為越來越完善的搜尋引擎而言。他們其實也早就考慮到了這個問題,首先是因為這些個語氣詞在搜尋過程中實際上是起不到任何作用的。

在搜尋引擎進行預處理的時候,他們也會把這些詞給過濾。一方面是減少檢索負擔,另一方面也是為了增加內容的準確度。

在搜尋引擎把蛛蛛抓取來的資訊進行歸檔之前,還有個程度是必不可少的,他必須得做內容的重複審核。一重意思:搜尋引擎必須把同乙個**裡的資料進行刪選。

有一種情況:比如有人在搜尋我的**寧波seo的時候,在排名結果中第一頁會出現我們的首頁與內容頁的可能性。其實做為乙個成熟的搜尋引擎來說,這種情況是要避免的。

因為這樣的內容對使用者的用處不大,就相當於同乙個內容給排了兩次。第二重:對於不同的**而言,因為網路上的內容那是成千上萬的。

這裡面就會出現兩個不同的**,但內容相同的情況。就是我們常說的**內容**的問題,搜尋引擎也會考慮到重複的資訊進行刪選。

有了上幾步的重重審核,接下來的就是得做個有效的資料整理。我列兩張表給大家看下就明白了:

正向索引檔案id內容檔案1關鍵詞1,關鍵詞2,關鍵詞7。。。關鍵詞x檔案2關鍵詞1,關鍵詞7,關鍵詞8.。。關鍵詞y。。。。。。。。

檔案n關鍵詞6,關鍵詞50.。。關鍵詞z倒排索引檔案id內容關鍵詞1檔案1,檔案2,檔案10,。。。檔案m關鍵詞2檔案1,檔案4,。。。。

檔案n關鍵詞7檔案1,檔案2,檔案8.。。。。。檔案o 我簡單的解釋一下上面的**裡的意思:正向索引**,也就是搜尋引擎臨時不能直接用於排名的資料表。

這個裡面他是按照檔案來分配每個關鍵詞的。也就是說主鍵是檔案。我們再換到第二張表來看,搜尋引擎已經把關鍵詞做為了主鍵,這也與我們搜尋某個關鍵詞來找自己想要的資訊一樣。

我們可以發現:當使用者搜尋關鍵詞7的時候,這個時候搜尋引擎就沒有必要對每篇內容再進行檢索,它只要做的就是從關鍵詞的詞庫裡面提取出檔案1,檔案2,檔案8等。

Seo之搜尋引擎的原理

在 優化過程中,我們首先要了解的就是搜尋引擎的原理,雖然我倡導不刻意的去研究搜尋引擎的演算法,但是對於seoer,在保證 質量的同時,注意搜尋引擎的演算法,略加變通會更好的提公升 的排名。我所反對的研究是以搜尋引擎為準則,內容的調整緊跟搜尋引擎的變化,這是一種本末倒置的優化方案,雖然它同樣會讓 有乙...

搜尋引擎工作原理

為什麼用,為什麼用谷歌?高效的搜尋有用的知識。搜尋引擎發展歷程 搜尋引擎的工作原理 首先搜尋引擎放出蜘蛛,來進行網際網路爬行。什麼是seo seo 的目的排名流量使用者體驗銷售 提高 的核心價值 做seo的人員我們應該知道,搜尋引擎是怎樣工作的,這樣才能更好的做優化。搜尋引擎的工作原理相當複雜。今天...

SEO搜尋引擎優化的經典技巧38條

seo 優化,已成建站之基礎工作。1 內容是seo的基礎,關鍵詞是seo的核心,鏈結是seo的關鍵,ueo是seo的深化。2 seo做得好的 都是一樣的,seo做得不好的 各有各的不同。3 要成為seoer,首先和 google yahoo等搜尋引擎談戀愛。4 seo沒有高手,只有新手和老手。5 選...