全國(guó)服務(wù)熱線:400-080-4418
說(shuō)它權(quán)威是因?yàn)槭荊oogle工程副總裁,負(fù)責(zé)排名算法的Udi Manber,發(fā)表在Google官方博客的一個(gè)帖子。下面撿主要內(nèi)容翻譯一下,想看完整原文的請(qǐng)參考Google官方博客Google 搜索質(zhì)量簡(jiǎn)介。
搜索質(zhì)量組是Google內(nèi)部負(fù)責(zé)搜索結(jié)果排名的。每天Google處理無(wú)數(shù)查詢,Google需要在不到一秒的時(shí)間內(nèi)從數(shù)以億計(jì)的網(wǎng)頁(yè)中選擇出應(yīng)該返回哪些,以及以哪樣的順序顯示。
Google對(duì)排名算法一直都比較保密,主要原因有兩條:競(jìng)爭(zhēng)及防止被濫用。
Google排名算法的細(xì)節(jié)是Google皇冠上的珍珠,我們以它為傲,并且非常注意保護(hù)。但是完全保密有時(shí)候也不是理想狀況,所以Udi Manber等人決定與站長(zhǎng)多溝通,談一談?dòng)惺裁葱迈r事,解釋一些老的內(nèi)容,給點(diǎn)建議,參與對(duì)話等。這篇帖子是第一篇,以后還會(huì)有其他內(nèi)容。
這個(gè)部門的心臟是核心排名小組。排名是相當(dāng)困難的,比大部分人所想象的更困難。其中一個(gè)原因是語(yǔ)言都是模棱兩可的,文件也沒有任何規(guī)則,怎樣理解信息沒有標(biāo)準(zhǔn)。所以我們需要理解任何人,因?yàn)槿魏卧蛩鶎懙娜魏尉W(wǎng)頁(yè)。這只是一部分。我們還需要理解用戶的查詢,再將查詢投射到我們所理解的文件上。更不要說(shuō)不同的人有不同的需求。而且我們需要在幾毫秒之內(nèi)完成這一切。
Google排名算法出名的部分就是PageRank。PR 現(xiàn)在還在使用中,不過(guò)已經(jīng)是一個(gè)更大的一系統(tǒng)中的一部分。其他部分還包括語(yǔ)言模塊(處理短語(yǔ),同義詞,方言,拼寫錯(cuò)誤等的能力),查詢模塊(不僅僅是語(yǔ)言,還包括人們?cè)鯓邮褂谜Z(yǔ)言),時(shí)間模塊(有的查詢返回一個(gè)30分鐘前剛創(chuàng)作的網(wǎng)頁(yè)合適,有的時(shí)候返回已經(jīng)存在很長(zhǎng)時(shí)間的網(wǎng)頁(yè)更合適),個(gè)性化模塊(不是每個(gè)人都需要相同的東西)。
另外一個(gè)組負(fù)責(zé)評(píng)估我們做的怎樣。目標(biāo)是改善用戶體驗(yàn),這不是主要目標(biāo),而是唯一的目標(biāo)。有每分鐘進(jìn)行的自動(dòng)評(píng)估,階段性整體質(zhì)量評(píng)估,更重要的還有個(gè)別算法調(diào)整的評(píng)估。當(dāng)某個(gè)工程師有個(gè)好主意,開發(fā)一個(gè)新算法后,我們對(duì)這個(gè)主意進(jìn)行測(cè)試。一組統(tǒng)計(jì)學(xué)家會(huì)檢查數(shù)據(jù),確定這個(gè)新主意的價(jià)值。
2007年,我們做了450次以上的調(diào)整,差不多每個(gè)星期9次。比如今年1月份,我們對(duì)PR算法做了大幅調(diào)整。大多數(shù)時(shí)間我們都是尋找相關(guān)性改善的方法,有時(shí)我們也致力于簡(jiǎn)化算法,簡(jiǎn)單就是好的。(Zac的注釋:關(guān)于簡(jiǎn)化算法這句話,是緊接著PR算法調(diào)整之后說(shuō)的,不確認(rèn)他是講簡(jiǎn)化了PR算法,還是說(shuō)籠統(tǒng)的對(duì)算法的簡(jiǎn)化。我的感覺是PR算法確實(shí)有了很大的改變。給我的感覺是,基本上給我們看的工具條PR是不準(zhǔn)的,尤其很多該有PR值得內(nèi)頁(yè)顯示PR為零。也許這就是Udi Manber所說(shuō)的算法簡(jiǎn)化造成的。)
在過(guò)去兩年中,國(guó)際搜索是我們的主要焦點(diǎn)之一,包括所有的語(yǔ)言,而不僅限于主要語(yǔ)言。
另外一個(gè)小組專門負(fù)責(zé)新功能和用戶界面。Google的用戶搜索界面相當(dāng)簡(jiǎn)單,當(dāng)我們?cè)黾有鹿δ軙r(shí),盡量確保對(duì)用戶來(lái)說(shuō)是簡(jiǎn)單易用的。在過(guò)去一年中,主要的改變包括整合搜索,Google Notebooks,自定義搜索引擎以及iGoogle的改進(jìn)。用戶界面小組有一組易用性專家,在輔助研究用戶及評(píng)估新功能。
還有一個(gè)小組專注于反垃圾和其他各種被濫用的技巧,這也就是Matt Cutts所負(fù)責(zé)的小組。這個(gè)組識(shí)別新的垃圾技術(shù),并且以可擴(kuò)展的方式克服這些垃圾。和其他組一樣,這個(gè)組也是要處理國(guó)際多語(yǔ)種。反垃圾組與Google站長(zhǎng)工具組緊密配合。
還有其他專門的項(xiàng)目組。整體來(lái)說(shuō)我們的組織結(jié)構(gòu)相當(dāng)非正式,人員調(diào)動(dòng)頻繁,新項(xiàng)目也隨時(shí)開始。
Copyright 2008 © 上海網(wǎng)至普信息科技有限公司 All rights reserved. 滬ICP備11006570號(hào)-13
滬公網(wǎng)安備 31011402007386號(hào)