人工智能正改變谷歌搜索,下一個(gè)目標(biāo)則是整個(gè)互聯(lián)網(wǎng)
近日,46歲的負(fù)責(zé)谷歌搜索業(yè)務(wù)的元老Amit Singhal宣布退休。很快,谷歌透露,Singhal卸任的巨大空缺將由一個(gè)叫John Giannandrea的人來填補(bǔ)。在某種層面上講,這只是兩個(gè)人各自開啟新的生活。但你也可以將兩人的職位更替看做是對(duì)谷歌內(nèi)部——甚至是整個(gè)科技界運(yùn)轉(zhuǎn)方式之重大轉(zhuǎn)變的一個(gè)絕妙隱喻。
要知道,Giannandrea正是谷歌人工智能的掌舵人。他的業(yè)務(wù)范圍包括深層神經(jīng)網(wǎng)絡(luò)和模擬人腦神經(jīng)結(jié)構(gòu)的軟硬件網(wǎng)絡(luò)。通過分析大規(guī)模的數(shù)據(jù),這些神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)各種有用的任務(wù),如照片識(shí)別、智能手機(jī)語(yǔ)音命令識(shí)別,以及正在發(fā)生的——網(wǎng)絡(luò)搜索查詢響應(yīng)(Internet search queries)。有時(shí)候,它們學(xué)習(xí)任務(wù)的能力甚至超越了人類——這些神經(jīng)網(wǎng)絡(luò)能做的更好、更快,并且能夠完成更大規(guī)模的任務(wù)。
這個(gè)叫做深度學(xué)習(xí)的方法正迅速改造互聯(lián)網(wǎng)一系列最熱門的應(yīng)用:從Facebook,到Twitter,再到Skype。過去幾年中,它也重新定義了谷歌搜索——整個(gè)公司最賺錢的業(yè)務(wù)。正如彭博社(Bloomberg)最近的報(bào)道,谷歌從2015年初開始在其搜索業(yè)務(wù)中部署一個(gè)叫做RankBrain的深度學(xué)習(xí)系統(tǒng)。到了十月,RankBrian已經(jīng)在谷歌搜索引擎每秒處理的數(shù)百萬個(gè)查詢?nèi)蝿?wù)中的「非常大的一部分」中發(fā)揮了作用。
據(jù)彭博社報(bào)道,正是Singhal本人批準(zhǔn)了RankBrain的應(yīng)用。此前,他或許已經(jīng)帶領(lǐng)團(tuán)隊(duì)進(jìn)行過對(duì)其他更簡(jiǎn)單的機(jī)器學(xué)習(xí)的探索。但是,據(jù)稱Singhal曾一度堅(jiān)決反對(duì)在谷歌搜索中應(yīng)用機(jī)器學(xué)習(xí)——過去,谷歌主要依賴于人工算法,它們嚴(yán)格遵循人類所定制的一系列規(guī)則。一些前谷歌員工描述了對(duì)機(jī)器學(xué)習(xí)的擔(dān)憂:人類更難理解神經(jīng)網(wǎng)絡(luò)(相較于人工算法)的工作方式,也就更難對(duì)其進(jìn)行優(yōu)化。
這些擔(dān)憂仍然威脅著機(jī)器學(xué)習(xí)領(lǐng)域。事實(shí)上,即便專家們并不能完全理解神經(jīng)網(wǎng)絡(luò)的工作原理,但它們實(shí)實(shí)在在的在起著作用:如果你向一個(gè)神經(jīng)網(wǎng)絡(luò)輸入足夠多的鴨嘴獸圖片,它便能學(xué)著鑒別鴨嘴獸;如果你輸入足夠多的惡意代碼,它便能識(shí)別電腦病毒;如果你輸入的是大量的自然語(yǔ)言——人們?cè)谒阉饕嬷锌赡茌斎氲脑~或短語(yǔ),它便能學(xué)著理解這些搜索命令并給出結(jié)果。在一些例子中,神經(jīng)網(wǎng)絡(luò)比工程師們寫的算法更好地執(zhí)行了搜索任務(wù)。人工智能是谷歌搜索的未來——如果是谷歌搜索的未來,也即是互聯(lián)網(wǎng)更多領(lǐng)域的未來。
堅(jiān)守規(guī)則
去年秋天,我與一位不愿透露姓名的前谷歌員工(他未被授權(quán)公開談?wù)摴镜膬?nèi)部事務(wù))討論了神經(jīng)網(wǎng)絡(luò)在谷歌搜索引擎中的作用。他說道,谷歌的廣告團(tuán)隊(duì)曾一度利用神經(jīng)網(wǎng)絡(luò)來協(xié)助定位廣告,但「有機(jī)搜索(organic search)」團(tuán)隊(duì)對(duì)這一技術(shù)并無好感。的確,這些年來關(guān)于這一爭(zhēng)議的討論仍不時(shí)涌現(xiàn)在Quora(一個(gè)廣受歡迎的問答網(wǎng)站)上。
《高效的工程師》(The Effective Engineer)一書的作者,曾就職于谷歌搜索團(tuán)隊(duì)的Edmond Lau 在Quora上寫道:Singhal對(duì)機(jī)器學(xué)習(xí)抱著哲學(xué)上的偏見。他這樣描述機(jī)器學(xué)習(xí)帶來的困擾:「給定一個(gè)查詢請(qǐng)求,人們很難解釋,為什么某個(gè)特定的搜索結(jié)果排名高于另一個(gè)。」另外,他還補(bǔ)充道:「很難直接調(diào)整基于機(jī)器學(xué)習(xí)的系統(tǒng)來提高某一訊息的重要性?!挂恍┢渌肮雀鑶T工對(duì)這一描述表示贊同。
是的,谷歌的搜索引擎曾由能夠自動(dòng)響應(yīng)搜索查詢的算法所驅(qū)動(dòng),但這些算法相當(dāng)于一系列明確的規(guī)則。谷歌的工程師們能夠輕易地改變和優(yōu)化這些規(guī)則——而且,與神經(jīng)網(wǎng)絡(luò)不同,這些算法不會(huì)自我學(xué)習(xí)。正如Lau寫道:「基于規(guī)則的評(píng)價(jià)標(biāo)準(zhǔn)雖有其繁冗之處,卻讓工程師們能夠針對(duì)特殊情況對(duì)權(quán)重直接進(jìn)行調(diào)整。」
但現(xiàn)在,谷歌已經(jīng)將深度學(xué)習(xí)整合到其搜索引擎中。隨著人工智能的負(fù)責(zé)人接管搜索業(yè)務(wù),谷歌似乎已經(jīng)堅(jiān)定了這一趨勢(shì)。
失控
誠(chéng)然,應(yīng)用神經(jīng)網(wǎng)絡(luò)意味著一定程度上的失控。「但也并不是完全無法掌控,」深度學(xué)習(xí)創(chuàng)業(yè)公司Skymind的創(chuàng)始人說道。其實(shí)神經(jīng)網(wǎng)絡(luò)不過是數(shù)學(xué)——線性代數(shù),工程師們毫無疑問能夠追蹤這個(gè)多層結(jié)構(gòu)中數(shù)據(jù)的變化。問題是,人類很難理解神經(jīng)網(wǎng)絡(luò)為什么以某種特定的方式將一張照片、一段語(yǔ)音或自然語(yǔ)言進(jìn)行歸類。
「人們能夠理解深度學(xué)習(xí)背后的線性代數(shù),但是這個(gè)模型并非人類可理解,而是機(jī)器可理解的」,Nicholson說道,「它們可以給出非常精確的結(jié)果,但我們常常不能從人類的角度去解釋這些結(jié)果背后的道理?!?/p>
也就是說,為了優(yōu)化這些神經(jīng)網(wǎng)絡(luò),人類只能依靠直覺、試驗(yàn)和犯錯(cuò)來調(diào)整其數(shù)學(xué)模型——而且你必須不斷地加進(jìn)新的數(shù)據(jù)進(jìn)行訓(xùn)練,也就意味著更多地試驗(yàn)和犯錯(cuò)。這在理論上可行,但是錯(cuò)綜復(fù)雜。隨著谷歌搜索向人工智能模型邁進(jìn),誰也說不清這一舉動(dòng)怎樣讓其搜索結(jié)果避免不公平投訴,或者,面對(duì)投訴時(shí)調(diào)整其搜索結(jié)果的能力又會(huì)受到怎樣的影響。
這些考慮并非杞人憂天。最近,谷歌正面臨一項(xiàng)歐洲的反壟斷調(diào)查,涉及到谷歌是否不正當(dāng)?shù)貙?duì)其競(jìng)爭(zhēng)對(duì)手的頁(yè)面進(jìn)行降級(jí)。如果真的完全讓人類所無法理解的機(jī)器做決定,到時(shí)候又該怎么辦呢? 人類依然會(huì)指導(dǎo)機(jī)器,但是不再像以前那樣了。
無論如何,谷歌搜索已經(jīng)迎來深度學(xué)習(xí)時(shí)代。而且近幾年中,谷歌也許已經(jīng)應(yīng)用過其他的機(jī)器學(xué)習(xí)形式。雖然這些技術(shù)讓人類在某種程度上失去掌控權(quán),但谷歌相信這利大于弊。
深度學(xué)習(xí)
可以肯定的是,深度學(xué)習(xí)仍只是谷歌搜索系統(tǒng)的一部分。據(jù)彭博社報(bào)道,谷歌每天收到的搜索請(qǐng)求大約有15%是其未曾見過的,而RankBrain正是用于處理這一部分請(qǐng)求的。它主要的功能就是分析搜索請(qǐng)求中不熟悉的字詞和短語(yǔ),并且給出與其意義相似的詞句。因此,在處理陌生搜索請(qǐng)求方面,RankBrain遠(yuǎn)勝過傳統(tǒng)的基于給定規(guī)則的系統(tǒng)。
全部評(píng)論