如何理解PageRank等網頁權重值

2022-08-27 05:15:04 字數 1303 閱讀 1191

目前搜尋引擎中常見的個性化資訊推薦方式主要有兩種:一種是查詢改進;一種是個性化網頁權重。前者主要是利用改變使用者實際搜尋的關鍵詞內容來表達使用者的個性化資訊需求,而後者主要是根據網頁權重對結果網頁進行排序來表達使用者的個性化資訊需求。

基於個性化網頁權重的推薦方法和基於查詢改進的推薦方法相比,具有很多優勢,主要表現在以下幾個方面:

一是經過實踐證明,諸如pagerank等網頁權重值是一種較為有效反映網頁客觀重要性的指標,同時相應演算法具有技術易行性。

二是演算法主要解決了網頁客觀重要性的評價問題,可以在網頁相關度排序上發揮作用。也就是說,該演算法能夠將滿足使用者個性化要求的網頁放在結果網頁集合的最前端。事實上,這更有助於使用者得到所需的個性化資訊。

最後,相關的網頁權重計算工作無需**進行,只需利用離線階段的儲存資料即可計算,從而能夠有效節省使用者查詢所需要的時間開銷。

基於個性化網頁權重的推薦演算法思想是在傳統的網頁權重演算法基礎之上,通過合理地修改和新增其中使用的具體引數,以表達不同使用者的個性化需求特徵,從而計算出不同使用者所特有的網頁權重值,並在使用者查詢時,利用這個值來計算網頁的相關度和優先順序。

較為常見的個性化網頁權重方式為個性化pagerank方法。傳統的pagerank是一種用於查詢結果網頁的相關度排序技術,它通過網頁問的鏈人和鏈出關係來計算不同網頁的權重值,並據此來實現網頁排序。這種演算法目前已有多種衍生型別,主要目的都是著眼於對結果做進一步的資訊表達。

其中,最為常見的做法是使用個性化pagerank向量來表達不同使用者的個性化資訊需求,並使用此向量計算網頁的相關度,從而產生針對特定使用者的個性化搜尋結果。

個性化pagerank演算法主要依據個性化pagerank向量來使結果網頁產生對特定使用者的偏好特性。其中,很多演算法都是以基於web的圖論演算法為基礎的,最為常見的模型有馬爾可夫模型等。對於馬爾可夫模型,人們已經提出了很多不同的具體型別,如一階馬爾可夫鏈模型、高階馬爾可夫鏈模型和混合馬爾可夫鏈模型等。

其中,一階馬爾可夫鏈模型雖然能對序列依賴給出乙個簡單的描述方法,但是它沒有考慮網路衝浪行為的長效記憶特徵;高階馬爾可夫鏈模型能夠更加準確地**導航路徑,但是它也會隨著維度增多而產生覆蓋度和計算複雜性的權衡問題,且這種複雜模型通常要求相當大的訓練集;混合馬爾可夫鏈模型組合了各階的馬爾可夫模型,在預處理和訓練的時候也需要更多的資源。

顯然,此處的演算法和選用的模型是相關的,要根據對簡易性和正確性的權衡情況來決定所選模型型別,甚至是一些其他模型,這些其他模型多半採用基於樹狀導航圖結構的資料探勘演算法,如聚類、序列模型挖掘、頻繁項挖掘等。

現在人們提出的個性化pagerank方法雖然有很多,但是主要分為兩大類:一類是直接修改基於超鏈關係得到的網頁權重值;另一類是在傳統pagerank公式上新增修正引數來反映使用者的個性化要求。

《動物尾巴的用處》等閱讀理解

暑期練習三 一 閱讀理解 一 動物尾巴的用處 你知道動物的尾巴有什麼用處嗎?魚的尾巴就是船上的舵,魚游動的時候,要靠尾巴掌握前進的方向。牛的尾巴就是一條長鞭子。夏天,牛總是不停地把尾巴甩來甩去,趕走叮在背上的蒼蠅和蚊子。狗的尾巴能表示友好。狗見到主人,尾巴就會搖個不停。假如狗見到不認識的人,它馬上就...

如何分析網頁的布局

當我們在瀏覽乙個網頁時,我們會發現網頁的組成元素logo,導航條,列表等內容的位置會隨著網頁主題分類置於網頁的不同位置。那麼,怎樣分析乙個網頁的布局成了製作乙個網頁眉要任務,對於電子商務 個人主頁。我們要學會分析,這樣,製作出來的網頁就會給人們一目了然判斷出是什麼乙個什麼主題的 下面,我就和大家認識...

如何理解培訓

關於調整龍山頭煤礦安全監測監控及維護管理組織機構的決定 為了認真落實 安全第一,預防為主,綜合治理 的煤礦安全生產方針,確保煤礦安全生產,經礦研究決定成立龍山頭煤礦安全監測監控及維護管理小組。一 組織機構組成 管理小組組長 劉德明 副組長 牛雙鑫 成員 王畢金袁輝何維鑫龍光明溫碧娟黃娟楊紅連 二 管...