一直以來(lái),我很少去網(wǎng)上搜什么東西,因?yàn)槲抑两襁有這樣的觀點(diǎn):我是做內(nèi)容產(chǎn)品的,我一直堅(jiān)持自己的原創(chuàng)給搜索引擎供貨的定位。如果我都去搜,還不如網(wǎng)友自己去搜,我們這些人就等于廢了,我再去搜什么,不但我對(duì)不起網(wǎng)友,害的搜索引擎也對(duì)不起網(wǎng)友。
可是從去年8月3日,我不得不上網(wǎng)搜我自己8月2號(hào)傳火炬的照片(現(xiàn)場(chǎng)不讓帶照相機(jī)),突然發(fā)現(xiàn),我在谷歌和百度網(wǎng)搜索出的數(shù)字結(jié)果不同,有時(shí)同一詞竟然差了3倍!這是怎么回事?我該相信誰(shuí)?直到這個(gè)月我才有空想起來(lái)我還是沒(méi)弄懂這個(gè)問(wèn)題,加上搜索結(jié)果重復(fù)太多,造成了數(shù)據(jù)垃圾,這些問(wèn)題是由于什么引起的?能不能解決呢?于是這幾天我就做起搜索試驗(yàn)來(lái)。
上周2、3、4、5,我找了13個(gè)詞作為搜索樣詞,連搜四天,發(fā)現(xiàn)結(jié)果并不一樣(見(jiàn)文章結(jié)尾),而且這些結(jié)果都沒(méi)有零頭。這些結(jié)果不但在變化,而且排序也在變化,中、英文兩個(gè)搜網(wǎng),還有明顯差異……于是,我撥通了谷歌和百度公關(guān)主管的電話,并請(qǐng)他們替我找了各自網(wǎng)站的技術(shù)大拿,他們對(duì)我的問(wèn)題回答如下:
谷歌公司
問(wèn):為什么同一詞你們網(wǎng)站搜出來(lái)的結(jié)果比其他網(wǎng)站多?是不是說(shuō)明你們的結(jié)果沒(méi)有合并同類項(xiàng)的功能?
答:搜出來(lái)的數(shù)量多少,一定會(huì)誤導(dǎo)網(wǎng)友,但是我們追求是答案的多樣性。
問(wèn):為什么你們和其他搜索網(wǎng)站都是一樣,結(jié)果不顯示千位以下的零頭?
答:因?yàn)榍灰韵碌慕Y(jié)果沒(méi)有意義,除非結(jié)果本身就低于千個(gè),當(dāng)然這樣的結(jié)果會(huì)給出零頭。
問(wèn):為什么同一單詞如Core I7用英文搜出的結(jié)果比用中文“酷睿”多很多?是不是說(shuō)明你們的中文搜索不行?
答:搜索英文我們是全球網(wǎng)站上搜,當(dāng)然多,我們中文搜出結(jié)果也會(huì)越來(lái)越多。
問(wèn):為什么搜同一詞,結(jié)果總是在變?而且排序也在變?
答:因?yàn)樗殉鼋Y(jié)果的計(jì)算公式,是考慮了上百、甚至上千條變量在進(jìn)入公式實(shí)時(shí)計(jì)算,至于排序是根據(jù)加入了實(shí)時(shí)點(diǎn)擊率等變量,得出排序不同。
問(wèn):那也就是說(shuō),如果一個(gè)不活躍的詞就會(huì)一直不變,例如IBM這個(gè)詞,我堅(jiān)持了4天,基本兩個(gè)網(wǎng)站沒(méi)變,都在1.74—1.71億之間?
答:是的
百度公司
問(wèn):我在你們公司的網(wǎng)站上和谷歌網(wǎng)站搜出同一詞的結(jié)果總是少的多,甚至是差幾十倍,拿“快女”來(lái)說(shuō),6月3日周三,谷歌是1.07億,百度則是177萬(wàn),為什么?是不是你們將同類項(xiàng)合并了呢?
答:是的,我們將相似的結(jié)果合并掉,我們認(rèn)為,如果能給出一個(gè)結(jié)果,對(duì)網(wǎng)友來(lái)說(shuō)是最好的結(jié)果。
問(wèn):為什么搜出結(jié)果都不顯示千位以下的零頭?
答:千位以下的零頭,沒(méi)有什么意義
問(wèn):為什么英文同一單詞比谷歌少?
答:我已答過(guò),我們已將相似結(jié)果合并。
問(wèn):為什么搜出結(jié)果每時(shí)每刻總在變化,而且排序也不斷變化?
答:除了是實(shí)時(shí)計(jì)算變量在變之外,我們每天還有換庫(kù)時(shí)間,在換庫(kù)時(shí)間點(diǎn)上顯示出來(lái)的結(jié)果也會(huì)不同。
結(jié)論
既然各搜索網(wǎng)站對(duì)搜索目標(biāo)的算法、分詞、合并、商業(yè)模型等等都不一樣,各有所長(zhǎng),是不是會(huì)導(dǎo)致到目前為止,搜索引擎?zhèn)性化的發(fā)展,還會(huì)各有各的生存空間。
文章已經(jīng)結(jié)束了,寫(xiě)文章的開(kāi)頭是因?yàn)椴槲业幕鹁嬲掌_(kāi)始,我的事情還是要用我自己來(lái)結(jié)尾。我還是不明白,為什么在搜我自己名字的時(shí)候,百度竟比谷歌競(jìng)?cè)欢嗔?倍!既然百度是合并同類項(xiàng),為什么還會(huì)有這么多,難道是百度對(duì)我有優(yōu)惠?謝謝百度!谷歌是全球的頁(yè)面同時(shí)搜索,為什么還會(huì)比百度合并同類項(xiàng)后少?我也挺尊敬谷歌的啊。
搜索我真的不知道該相信誰(shuí)!
摘自:http://www.fsasp.cn/news.asp?id=772
(本站大部分文章來(lái)自網(wǎng)絡(luò)收集和整理,如有侵權(quán)請(qǐng)聯(lián)系我們,24小時(shí)內(nèi)處理.)
|