Amazon語音助手能給你一個確定的回答,卻給不了信息世界的真相_風聞
栈外-栈外官方账号-2020-01-17 21:01
本文看點
▪ 劍橋AI大咖威廉·滕斯托爾-佩多曾認為,計算機不應該像圖書館那樣,要求人們費力地檢索信息,而應提供即時的、完美的、單一的答案。在此設想上,他創立了True Knowledge網站,其數字大腦分為三個部分:自然語言處理系統、收集事實、編碼關聯。隨着智能音箱的興起,True Knowledge被Amazon收購,共同推出了Amazon語音助手音箱Echo。
▪ 之後各大科技公司紛紛意識到了語音問答是大勢所趨,Google、Facebook、Apple、Amazon都各自收購了知識圖譜製作公司,以更好地一次性提供單一答案。這種發展趨勢使傳統網頁的利益相關者情況危急。由於廣告位減少,一場爭奪廣告位的戰爭即將出現,廣告位費用理論上會大大提升;此外,因為搜索引擎直接給出答案,網絡出版商的流量也會急劇減少。
▪ 語音搜索也存在極大風險。單一答案的形式暗示事實都是簡單絕對的,讓提供語音搜索服務的公司獲得了裁定信息真偽的權利,它們開始主宰人們的認識。人工智能的失誤會誤導用户,而信息來源的模糊也削弱了人們分辨是非的能力,一旦習慣了這些便捷的工具,好奇心和深入思考的能力也會被削弱。
原文來自Wired,作者James Vlahos
如果你在上世紀90年代末參觀過劍橋大學圖書館,你可能會看到一個瘦削的年輕人在書架間“露營”,筆記本電腦屏幕的光芒照亮了他的臉。
威廉·滕斯托爾-佩多已在幾年前就完成了他的計算機科學研究,但他仍然享受着舊紙散發出的黴味,以及被書環繞的感覺。凡是在英國出版的書籍,這個圖書館幾乎都收藏了副本。500萬本書和120萬期雜誌,大量的信息都給了他靈感。
當然,也就是在這個時候,另一個巨大的知識寶庫,即互聯網,正在形成。Google以其著名的使命宣言“組合全球的信息,使其隨手可得,隨處可用”,自豪地扮演着地球圖書管理員的角色。
儘管滕斯托爾-佩多喜歡徜徉於書架間,但他覺得計算機不應該像圖書館那樣,要求人們費力地檢索信息。是的,瀏覽搜索結果、發現新來源和相關事物確實很有趣。但大多數用户真正想要的是答案,而不是搜索的快感。
作為實現這一目標的工具,**搜索引擎曾和圖書館一樣笨拙。**首先,你必須想出正確的關鍵詞。接着,你得猜猜Google和Yahoo提供的一大串鏈接中哪個才是最好的。然後,你得點擊鏈接,進入一個網頁,希望它包含你要找的信息。
滕斯托爾-佩多認為,這項技術應該像《星際迷航》裏飛船上的電腦那樣:用日常用語問一個問題,就能得到一個“即時的、完美的答案”。他相信,搜索引擎作為樂於助人的圖書管理員,最終一定會屈服於AI,成為無所不知的神諭。
這在當時是一個與飛行汽車一般的技術幻想,但滕斯托爾-佩多着手讓它成為現實。他13歲就開始當程序員賺錢,一直對教授機器自然語言十分着迷。
上大學時,他曾寫過一款名為Anagram Genius的軟件,給定一個名字或短語,該軟件會把字母巧妙地重新排序。例如,輸入“Margaret Hilda Thatcher(瑪格麗特·希爾達·撒切爾)”,重排字母就變成了“A girl, the arch mad-hatter(一個女孩,徹頭徹尾的瘋帽子)”。
多年後,作家丹·布朗也使用了Anagram Genius來創作《達芬奇密碼》中的關鍵謎題。
而現在,躲在圖書館裏的滕斯托爾-佩多正開始構建一個能夠回答幾百個問題的原型。
20年後,隨着Amazon Alexa(和Echo關聯的語音助手)和Google Assistant等語音計算平台的崛起,全球最大的科技公司都陡然轉向了滕斯托爾-佩多的研究方向。
語音智能音箱已經成為了科技行業最暢銷產品之一;NPR電視台和研究公司Edison Research的一份報告顯示,僅在2018年,這些產品在美國家庭中的普及率就增長了78%。
根據一項市場調查,人們要求他們的智能音響回答問題的頻率比他們做其他任何事情的頻率都要高。滕斯托爾-佩多的設想是,計算機一次性響應我們的問題,也就是提供搜索社區所稱的一次性答案,而這種設想已經成為主流。
**互聯網及其支持的數十億美元的商業生態系統正在發生不可逆轉的變化。**信息的創造、傳播和控制也是如此——這正是我們所知所得的本質。
2007年,經受了網絡產業崩潰及其餘波的考驗後,滕斯托爾-佩多和幾位同事即將推出他們的第一個產品——一個名為“True Knowledge”的網站,它可以為各種問題提供一次性的答案。
**當時,他們的“一次性答案”目標仍然是異端。**滕斯托爾-佩多説:“在Google裏,有些人對我們所做的事情完全過敏。一次性答案是一種禁忌。”他回憶起自己曾與Google的一名高級員工爭執,對方甚至拒絕單一正確回覆這種説法。
那時的大型搜索引擎雖然索引了數十億個網頁,但並未深刻理解用户的查詢。相反,它們做的只是美化猜測:你在Google的搜索欄裏輸入幾個關鍵詞,公司的PageRank網頁排名系統就會根據數據推測你想知道的是什麼,在網頁上顯示一大堆推測結果。
為了證明True Knowledge一次性答案的抱負是可能實現的,滕斯托爾-佩多和他在劍橋的小團隊開發了一個數字大腦,由三個主要部分組成。
第一個是自然語言處理系統,它試圖強有力地解釋問題。例如,“有多少人居住”、“這裏人口有多少”和“規模有多大”都可以表示為關於一個地方的居民數量的查詢。
系統的第二部分是收集事實。不像其他搜索引擎只是簡單地將用户指向別的網站,True Knowledge渴望自己提供答案。它需要知道倫敦有880萬人口,勒布朗·詹姆斯有6英尺8英寸高,喬治·華盛頓的臨終遺言是“很好”,等等。
這些事實中的絕大多數都不是人工輸入系統的;如果要人工輸入,那就太艱難了。相反,它們是從結構化數據的來源自動檢索而來的,這些信息以計算機可讀的格式列出。
最後,系統必須對這些事實的關聯進行編碼。程序員們創建了一張知識圖譜,就像一個巨大的樹狀結構。
它的基礎為“對象”這個類別,包含所有事實。向上看,“對象”又分為“概念對象”(用於社會和心理構造)和“物理對象”(用於其他一切)。
你爬得越高,分類就越精細。例如,“軌道”被分為“路線”、“鐵路”和“道路”等組。
構建本體是一項艱鉅的任務,它擴展到了數萬個類別,包含了數億個事實。但它所提供的結構可以對新信息進行分類,就像將衣物分類到各個抽屜一樣。
知識圖譜從分類學的角度對關係進行編碼:道格拉斯冷杉是針葉樹的一種,針葉樹是植物的一種,等等。但除了簡單地表示兩個實體之間存在聯繫外,該系統還描述了每個聯繫的性質:大本鐘位於英國,法國人埃馬紐埃爾·馬克龍是法國現任總統。
這意味着,True Knowledge有效地學習了一些關於世界的常識規則,儘管這些規則對人類來説是顯而易見的,但通常是計算機所無法企及的:某地標建築只存在於一地,而法國只能有一位現任總統。
最令滕斯托爾-佩多感到興奮的是,True Knowledge能夠處理那些並未事先明確答案的問題。想象一下,如果有人問:“蝙蝠是鳥嗎?”因為本體將蝙蝠歸入“哺乳動物”之下的一個子類,而鳥類則位於其他地方,所以該系統可以正確地推斷出蝙蝠不是鳥類。
True Knowledge越來越聰明,**在投資者面前,滕斯托爾-佩多常常對競爭者嗤之以鼻。**例如,他可能會在Google搜索:“麥當娜是單身嗎?(Is Madonna single?)”搜索引擎返回了“未發佈的麥當娜單曲”的鏈接(single也有單曲的含義),顯然,Google對問題的理解非常膚淺。
與此同時,True Knowledge從問題的表述方式得知,“single”作形容詞,而非名詞,其定義為“沒有戀愛關係”。所以,當系統發現麥當娜和蓋·裏奇(當時)這兩個名字以“結婚”一詞聯繫,就給出了更有幫助的回答:“不,麥當娜不是單身。”
**投資者對此很滿意,於是在2008年啓動投資。**True Knowledge的規模擴大至約30名員工,他們搬到了劍橋一個更大的辦公室。
然而,這項技術一開始並沒有受到消費者的歡迎,部分原因是它的用户界面像是“一個醜孩子”。
因此,他重新推出了設計簡潔的True Knowledge智能手機App,可以在iPhone和Android設備上使用。它有一個單眼笑臉的可愛標識,以及一個朗朗上口的新名字,Evi。最重要的是,你可以把你的問題講給Evi聽,然後聽取它們的回答。
2012年1月,就在Apple發佈Siri語音助手後的幾個月,Evi首次亮相,並迅速成為Apple應用商店榜單第一名,下載量超過50萬次。Apple顯然被《Evi:Siri的新死敵》之類的標題激怒了,一度威脅要撤掉這款App。
**許多人都向滕斯托爾-佩多表達了收購意圖。**經過一系列會談,True Knowledge同意被收購。
大部分人都能保住工作,留在劍橋,而滕斯托爾-佩多則將成為一個尚未發佈的語音計算設備產品團隊的高級成員。2014年,這款設備問世,它問題回答的能力因Evi而大大增強。
收購True Knowledge的買家是Amazon,而這款設備就是Echo。
滕斯托爾-佩多還在劍橋大學學習編程的時候,一次性答案這個概念並不流行。但當Echo出現之後,情況就不一樣了。在語音計算時代,提供單一答案不僅是一個很好的功能,還是必要的功能。
滕斯托爾-佩多表示:“你無法通過語音提供10條藍色鏈接,這是一種糟糕的用户體驗。”
當世界上最大的那些科技公司逐漸醒悟,它們紛紛開始追溯True Knowledge當年的腳步。
2010年,Google收購了Metaweb,這是一家創建Freebase本體的初創公司。兩年後,該公司推出其知識圖譜,號稱擁有35億個事實。同年,Microsoft推出了後來被稱為“概念圖”的產品,它包含了500萬個實體。
**2017年,Facebook、Amazon和Apple都各自收購了知識圖譜製作公司。**許多研究人員已經開始設計自主系統,這些系統在網絡上搜尋答案,以比人類更快的速度為本體添加事實。
各大公司的緊鑼密鼓是有道理的。**市場分析師估計,到2020年,多達一半的互聯網搜索將是用語音完成的。**如今,即使是屏幕搜索領域的那些“老圖書管理員”也在悄悄地轉向這種“神諭”模式。
在Google搜索引擎的桌面版和移動版中,Google一直在穩步提升其提供一次性回答的精準度和普及率,它們的地位高於其他搜索結果。假如你搜索“宇宙中最稀有的元素是什麼?”查詢框下面就會顯示答案:“放射性元素——砹。”
根據營銷機構Stone Temple的數據,2015年7月,Google為超過三分之一的搜索結果顯示了即時答案,而18個月後,超過一半的搜索都是如此。
**這種向單一答案的轉變很緩慢,因而掩蓋了它最嚴重的後果:**互聯網的終結。傳統的搜索頁面正在為新的交流式的頁面讓步,繁瑣的網頁和鏈接逐漸被話癆的AI所取代,而AI在新的搜索方式中享有至高無上的統治地位。
據説,這樣搜索會更方便、更有效率。**但對傳統網頁的利益相關者來説,情況變得危急起來。**這些利益相關者包括商家、廣告商、網絡作家、網絡出版商和科技巨頭。對線上經濟來説,關注度比什麼都重要。
**公司想要人們的關注,想要人們看到他們發佈的廣告。**互聯網剛出現的時候,公司就開始研究如何利用搜索引擎優化功能(SEO)。
為了使公司的頁面出現在搜索結果更靠前的地方,他們會想盡辦法調整網頁上的關鍵詞和其他內容。為了確保一個靠前的位置,公司有時會直接付錢給搜索引擎公司,購買懸浮在搜索結果上方或旁邊的廣告。
還只有桌面搜索的時候,公司絞盡腦汁擠進搜索結果的前十個鏈接,因為人們一般不會再往下看了。而到了手機時代,範圍縮減到了前五個鏈接。
語音搜索出現後,公司面臨着更嚴峻的挑戰。他們都想佔據最佳位置——成為那個唯一的答案,凌駕於其他結果之上。這個位置非常重要,因為這個答案會被AI直接念出來。
格雷格·哈吉斯是市場營銷機構RAIN的副總裁,這個機構向公司提供交流式AI戰略方面的諮詢服務。根據哈吉斯的説法,通常AI只會念出這一個答案。他指出:“如果你不想幾年後消失在人們的視野裏,那就必須確保你的網站進行了針對語音搜索的優化。”
假如你開了一家壽司店,周圍有很多競爭對手。當用户用語音搜索系統詢問附近有什麼好的壽司店的時候,如果你的店不是AI通常會選擇的那家,你的麻煩就大了。
當然,就如在網頁上下滑動搜索結果那樣,用户在聽到AI的回答後,也可能會説:“這家店聽起來不怎麼樣,附近還有什麼別的店嗎?”不過這有點麻煩,人們通常會盡量避免麻煩。
**進入最佳地位所需的戰略與傳統的SEO完全不同。**如今,在網站中放入正確的關鍵詞已經不那麼重要了。
現在的SEO專家首先會研究用户會問的問題,例如:“有哪些牌子的混合動力汽車比較好?”再把這些問題連同精確的答案一起嵌入網站中。這樣做是為了在公司的網站中提供AI可以直接提取並讀出來的內容。
目前還沒有付費以出現在語音搜索結果中的服務,但這種服務必然會出現。到那時,**網絡廣告行業將會發生翻天覆地的變化。**由於語音搜索一次只出現一個結果,廣告商失去了很多投放廣告的地方。
傑瑞德·巴爾斯基是線上營銷機構360i的現任CEO,他在2017年告訴Adweek:“一場爭奪廣告位的戰爭即將出現,廣告位的費用理論上會大大提升,因為公司投放廣告的意願沒有減少,但廣告位變少了很多。”
這一現象在零售行業可能尤為突出,對Amazon這樣的公司來説,搜索引擎的背後是隨時準備購買商品的顧客,因此是否能成為AI的首選至關重要。這就像攀登珠穆朗瑪峯,要麼成功登頂,要麼死在半路上。
如果你的產品不是混合動力汽車,也不是辣金槍魚壽司,而是知識,情況又會是什麼樣的呢?
網絡出版商對現狀已經很不滿了。他們現在很大程度上依靠着科技巨頭帶來的流量,因此也要付這些公司許多廣告費用。根據數據分析公司Parse.ly的研究,線上出版商的流量一半都是Google搜索帶來的,還有四分之一來源於用户在Facebook上分享的鏈接。
語音搜索會進一步限制網絡出版商的流量。
舉例來説,我是Oregon Ducks籃球隊的粉絲。過去每場比賽的第二天,我都會上ESPN網站查看比賽結果。我可能還會點進一兩篇文章,給網站增加一點廣告收入。如果我心情好,説不定還會點擊訂閲。
但是現在我只需要問我的手機:“昨天誰贏了?”就能得到答案,ESPN也就再也得不到我的流量了。
不管你在不在乎ESPN失去流量,問題在於類似的情況會發生在大大小小的內容生產商身上。
拿布萊恩·沃納的經歷來説,他創建了一個叫做Celebrity Net Worth的網站。只要輸入名人的名字,這個網站就會告訴你他們的身價。如果在網站上輸入Jay-Z的名字,你就會發現他的身價為9.3億美元。
沃納説,在他明確拒絕了Google訪問他數據庫的要求後,這個搜索引擎巨頭開始從他的網站中獲取答案。在此之後,Celebrity Net Worth網站的流量降至原來的20%,導致他不得不裁去了一半的員工。
他問道:“還有多少網站和公司成為了Google的犧牲品?”
Google發言人拒絕直接對沃納的言論發表看法,但她指出,網站管理員可以使用Google的開發工具從而防止他們網站的內容出現在Google的精選摘要上。
AI從網站中提取內容的時候,有時也會附上來源。他們可能會在語音中提到,或者在有屏幕的設備中顯示來源。但是簡單地提及來源並不能給網站帶來收益,線上出版商需要的是流量,而傳統的語音搜索很難帶來流量。
Google 和Amazon針對這個問題提供的解決方法很粗糙:用户可以在Home或Echo的輔助應用中找到搜索結果,點擊鏈接,訪問網站。
用户確實可以這樣做,**但既然她已經得到答案了,又何必如此大費周章呢?**艾什·伊蘭是一名網頁流量專家,也是Dynamic Search公司的CEO。正如他在2013年的一篇博客中提到的,語音搜索提供的這種簡單明瞭的答案使局面完全倒向了Google。
“網站希望通過SEO和有趣的內容來提升自己在搜索界面的排名,”他寫道,“語音搜索讓用户直接就能獲得答案,我們失去了給用户留下印象的機會,這是我們不願看到的。”
在滕斯托爾-佩多着手開發True Knowledge 的時候,他注意到Google的一些員工對提供單一的搜索結果並不熱衷。儘管如此,公司的高層明確指出建立問答系統是公司的長期目標。
在2005年的一次訪談中,埃裏克·施密特問大家:“你們使用Google搜索時是不是每次都會得到不止一個答案?這是一個缺陷,我們應該一次性就給出正確的答案。”這是他離任CEO職位十多年前的事情了。
多年來,技術上的困難阻礙了這一目標的實現。這是有好處的。《通訊規範法案》第230條規定,網絡中間商不必對他人上傳的內容負責。這部法案頒佈於1996年,用於管理與網絡言論自由相關的事項。
只要Google還是信息的管道,而不是信息的創造者——一箇中立的圖書管理員,而不是全知全能的先知——它就能規避大量法律和道德的責任。
滕斯托爾-佩多説:“傳統搜索方式的一個好處是,Google不需要判斷這些內容的真假。”
然而在語音時代,Google公司的“信使無罪”的定位越來越難以被人接受。如果你點進一個鏈接,打開的是一篇《舊金山紀事報》的文章,Google顯然不用對文章的內容負責。
但如果Google Assistant回答了你的問題,責任的界限就變得模糊了。即使答案來自於第三方,你仍然會感覺是Google回答了這個問題。通過這種方式,**提供語音搜索服務的公司獲得了裁定對錯的權利。**它們開始主宰人們的認識。
丹尼·沙利文是負責Google搜索的一名公關,他2018年在一篇關於Google精選摘要的博客中提到了這種方式會帶來的問題。他説,直到最近,如果在Google搜索“羅馬人在晚上怎麼分辨時間?”,都會出現一個簡單可笑的答案:日晷。
這是一個不會帶來嚴重後果的錯誤,他也保證Google會努力確保這樣的錯誤不再發生。但是不難想象,類似的錯誤回答可能會帶來更嚴重的後果,尤其是現在越來越多的美國人開始使用語言搜索,把AI給出的答案當作不會出錯的神諭。
過去的一些例子包括:巴拉克·奧巴馬即將頒佈戒嚴令、伍德羅·威爾遜(美國第28任總統)曾是3K黨成員、味精會造成腦損傷、女人是邪惡的。
Google很快主動修正了這些令人啼笑皆非的錯誤,並解釋説這些答案不是由Google編寫的,而是AI自動從一些不可靠的網站中提取出來的。
**允許人們查看信息的來源,一定程度上可以防止錯誤信息的泛濫。**但是很難想象Home或者Echo的用户會願意頻繁登錄輔助軟件,查看信息來源,這對他們來説太麻煩了。這與語音搜索強調的方便快捷的理念恰恰相反。
語音回答中直接提到的信息來源又太模糊了。用户可能會被告知答案來自於Yahoo或者Wolfram Alpha,這相當於在説“我們公司從別的科技公司獲取了這則信息”。用户無法得知信息的作者和出處,也無法得知這個結論的推導過程。
如果信息來源於公司內部的知識圖譜或是其他內部資源,語音回答中的來源就更模糊了:“我們從公司內部獲得了這個信息,相信我們。”
**提供單一答案的言下之意是:****在這個世界上,事實都是簡單絕對的。**很多問題確實都只有一個正確答案:地球是圓的嗎?印度有多少人?但其他的問題都可以有許多不同的正確答案。這就使語音問答處在了尷尬的境地。
意識到這一點後,Microsoft的智能助理Cortana有時會對同一個問題給出兩個相反的答案。Google也在考慮採取相似的應對措施。不管這些公司想不想扮演“事實核查員”的角色,他們都已經沒有退路了。
**語音時代,大型科技公司掌控着信息的傳播。**人們開始擔憂是否會出現奧威爾作品中的那種知識控制。在政府嚴格監管互聯網的國家,這不僅僅是一種理論上的擔憂。
在民主國家,更緊迫的問題是,**大公司是否會為了自己的利益而操縱信息、篡改事實?****控制了知識就是控制了權力。**現如今,少量的公司操控着海量的信息流,從而獲得了至高的統治地位,這是過去從來沒有過的局面。
我們這些普通人則可能失去監督這些公司所需要的能力。一旦習慣了這些便捷的工具,我們可能就會失去好奇心和深入思考的能力,我們可能不會再主動追求真理,而指望真理自動出現在我們面前。如果水會從水龍頭裏自動流出來,為什麼還要費勁從井裏打水呢?
滕斯托爾-佩多在2016年離開了Amazon,因為他意識到語音問答可能會帶來新的風險,並且會加重現存的風險。但他有一種典型的工程師思維:科技造成的問題可以由更先進的科技解決,例如能夠識別出錯誤信息的AI。
如果語音搜索系統有一天能產生劍橋大學圖書館那樣的過時感,那他可能會產生一種懷舊的感覺,但這種感覺是有限度的。“我可能會懷念在Amazon工作的時光,”他説,“除非有必要,不然我是不會回去的。”