SEO核心算法:利用用戶點擊記錄改善搜索結果

現在是WEB2.0時代了(據真實傳言好像已經快4.0了,比微軟升級還快,我估計年底前會出現web5.0的說法,大家趕緊想想應該是什么,爭取第一個提出這個概念,為中國爭光),大家都在講UGC(用戶產生內容。My definition of UGC2.0:Used Garbage Content(come on,just a joke)),如果從利用用戶產生的內容來提高網站效果這個角度看,其實搜索引擎早幾年前已經邁入WEB2.0的行列了,因為搜索引擎會記錄用戶發出的查詢以及用戶點擊記錄,然后利用這些用戶產生的搜索記錄來進一步改善其他用戶的搜索結果。
 
盡管我們沒有察覺,其實每次用戶向搜索引擎發送的查詢以及之后的用戶行為都已經記錄在案了(個人隱私問題?其實這個很好解決,以后把“個人隱私”這個詞匯從人類語言中剔除,自然也就不會有個人隱私問題),比如一個用戶是“快男”(注:是快樂男聲,不是快槍手男人)的粉絲(一個疑問:為什么所有選秀節目的狂熱粉絲都是女士?),那么發出搜索“快男”,搜索引擎返回結果后,用戶點擊了搜索結果前三項的URL(廣告時間,請不要轉臺,后面結果更精彩)
 
陳楚生奪“快男”冠軍 蘇醒稱亞軍不輸冠軍
 
 
 
印記【79】快樂男聲塵埃落定:五強點評
 
 
 
湖南臺工作人員自爆快男三進二種種黑幕
 
 
 
搜索引擎會在后臺記錄如下:
 
<159.226.200.1,快男,(http://www.onejoo.com/story/80502/,1),
 
(http://www.onejoo.com/story/80485/,2,)(http://www.onejoo.com/story/80429/,3)>
 
其含義是:159.226.200.1這個用戶在搜索”快男”的時候點擊了后面這三項URL,每個URL在搜索結果中的排名分別是1,2,3名。
 
也就是說,用戶向搜索引擎發出一個查詢,搜索引擎返回搜索結果,記錄用戶針對這個查詢點擊過哪些網頁,點擊過的網頁會被認為在某種程度上是和這個查詢相關的網頁,在下次另外一個用戶發出同一查詢的時候,可能會提高(boost)這些用戶點擊過的網頁的排名。(其實,搜索引擎也可以利用這些信息來進行個性化搜索的工作)
 
為了正式真實證實這是真事(這個繞口令一點都不拗口吧:),我們看看百度和GOOGLE是否有這個過程。
 
我們先看百度。向百度提交查詢“玩聚”,然后查看搜索結果的頁面源代碼,可以看到第一條搜索記錄的源代碼片段為:
 
 
用戶行為記錄就是這個onclick了,(<a onclick="return c('b4d6',this.innerHTML,this.href,1)),用戶點擊的時候會激發onclick行為,其中this.href應該是代表href=http://www.onejoo.com/這個URL,數字1代表是本次搜索排在第一位的結果。諸如此類。
 
再看看GOOGLE,同樣的查詢,可以看到第四項搜索結果的源代碼:
 
 
這個onmousedown做的就是類似的事情了。(onmousedown="return clk(0,'','','res','4',''))
 
這個方法無疑會在某種程度上改善用戶的搜索體驗,但是它依賴于一個基本假設:用戶點擊過的URL是和當前查詢相關的頁面。其實很明顯這個假設是容易遭受理智的以及不理智的攻擊的,也就是說這個方法存在著問題,而且不是一個問題,也不是三個問題,是兩個問題:
 
    問題1:即使用戶在某次搜索結果里面點擊了某個網頁,但是并不代表這個網頁一定是和用戶發出的查詢相關的,完全有可能用戶點擊進去以后才發現其實這個網頁不是他想要的。所以如果把無關點擊記錄下來以后向其他用戶推薦,這些信息可能是噪音,會導致下次的結果更不準確,所以如何去除這種噪音是一個研究點。
 
問題2:從另外一個角度,即使有些沒有點擊過的搜索結果也有可能是相關的,但是這些信息沒有被利用起來,所以如何識別那些沒有點擊過但是也是很相關的網頁也是其中一個研究點。
 
問題3:UGC,你來提。
 
其實(其實今天才發現我挺愛用“其實”這個詞的,這是一個壞習慣,以后一定要避免濫用這個詞匯,其實這應該不難做到),記錄用戶的點擊行為除了做以上用途外,還有很多可以探索的用途,比如個性化搜索,比如以下的用途:
 
1.查詢-查詢關系:這個可以用來進行用戶查詢推薦(query suggestion)用戶想搜索引擎提交查詢,可以利用查詢之間的相似關系來向用戶推薦其它可能的查詢;
 
2.查詢-相關文檔關系:
 
可以利用用戶行為記錄推理出有趣的結論,比如假設兩個不同查詢的用戶點擊文檔集合,如果兩個點擊文檔集合很大程度是重合的,那么說明兩個查詢是語義上類似的或者等價的;
 
3.文檔-查詢關系
 
  從某篇被點擊過的網頁來說,可能有不同的查詢都導致某個網頁被點擊,那么可以把這些查詢和這個網頁綁定起來,說明他們之間有相關關系;
--------------------- 
作者:張俊林博客 
預約SEO專家添加微信號:2277679694 免費領取SEOVIP試聽教程

TAG標簽: 算法 點擊

文章標題:SEO核心算法:利用用戶點擊記錄改善搜索結果

轉載注明出處:http://www.guknvg.live/ask/20181018955.html

說點什么吧
  • 全部評論(0
    還沒有評論,快來搶沙發吧!