一直以來,我很少去網上搜什么東西,因為我至今還有這樣的觀點:我是做內容產品的,我一直堅持自己的原創給搜索引擎供貨的定位。如果我都去搜,還不如網友自己去搜,我們這些人就等于廢了,我再去搜什么,不但我對不起網友,害的搜索引擎也對不起網友。
可是從去年8月3日,我不得不上網搜我自己8月2號傳火炬的照片(現場不讓帶照相機),突然發現,我在谷歌和百度網搜索出的數字結果不同,有時同一詞竟然差了3倍!這是怎么回事?我該相信誰?直到這個月我才有空想起來我還是沒弄懂這個問題,加上搜索結果重復太多,造成了數據垃圾,這些問題是由于什么引起的?能不能解決呢?于是這幾天我就做起搜索試驗來。
上周2、3、4、5,我找了13個詞作為搜索樣詞,連搜四天,發現結果并不一樣(見文章結尾),而且這些結果都沒有零頭。這些結果不但在變化,而且排序也在變化,中、英文兩個搜網,還有明顯差異……于是,我撥通了谷歌和百度公關主管的電話,并請他們替我找了各自網站的技術大拿,他們對我的問題回答如下:
谷歌公司
問:為什么同一詞你們網站搜出來的結果比其他網站多?是不是說明你們的結果沒有合并同類項的功能?
答:搜出來的數量多少,一定會誤導網友,但是我們追求是答案的多樣性。
問:為什么你們和其他搜索網站都是一樣,結果不顯示千位以下的零頭?
答:因為千位以下的結果沒有意義,除非結果本身就低于千個,當然這樣的結果會給出零頭。
問:為什么同一單詞如Core I7用英文搜出的結果比用中文“酷睿”多很多?是不是說明你們的中文搜索不行?
答:搜索英文我們是全球網站上搜,當然多,我們中文搜出結果也會越來越多。
問:為什么搜同一詞,結果總是在變?而且排序也在變?
答:因為搜出結果的計算公式,是考慮了上百、甚至上千條變量在進入公式實時計算,至于排序是根據加入了實時點擊率等變量,得出排序不同。
問:那也就是說,如果一個不活躍的詞就會一直不變,例如IBM這個詞,我堅持了4天,基本兩個網站沒變,都在1.74—1.71億之間?
答:是的
百度公司
問:我在你們公司的網站上和谷歌網站搜出同一詞的結果總是少的多,甚至是差幾十倍,拿“快女”來說,6月3日周三,谷歌是1.07億,百度則是177萬,為什么?是不是你們將同類項合并了呢?
答:是的,我們將相似的結果合并掉,我們認為,如果能給出一個結果,對網友來說是最好的結果。
問:為什么搜出結果都不顯示千位以下的零頭?
答:千位以下的零頭,沒有什么意義
問:為什么英文同一單詞比谷歌少?
答:我已答過,我們已將相似結果合并。
問:為什么搜出結果每時每刻總在變化,而且排序也不斷變化?
答:除了是實時計算變量在變之外,我們每天還有換庫時間,在換庫時間點上顯示出來的結果也會不同。
結論
既然各搜索網站對搜索目標的算法、分詞、合并、商業模型等等都不一樣,各有所長,是不是會導致到目前為止,搜索引擎個性化的發展,還會各有各的生存空間。
文章已經結束了,寫文章的開頭是因為查我的火炬照片開始,我的事情還是要用我自己來結尾。我還是不明白,為什么在搜我自己名字的時候,百度竟比谷歌競然多了3倍!既然百度是合并同類項,為什么還會有這么多,難道是百度對我有優惠?謝謝百度!谷歌是全球的頁面同時搜索,為什么還會比百度合并同類項后少?我也挺尊敬谷歌的啊。
搜索我真的不知道該相信誰!
摘自:http://www.fsasp.cn/news.asp?id=772
(本站大部分文章來自網絡收集和整理,如有侵權請聯系我們,24小時內處理.)
|