新的亞馬遜Alexa人工智能在實驗室中停留,直到能夠超越ChatGPT - 彭博社
Austin Carr, Matt Day
插圖由731提供;照片:亞馬遜
安迪·賈西不斷向Alexa提出體育問題。那是2023年夏天,亞馬遜公司的首席執行官想看看升級了人工智能的語音助手原型是否足夠好,能夠與OpenAI的AI聊天機器人ChatGPT競爭,後者在大約八個月前以其對話能力震驚了世界。
因此,賈西作為一名忠實的紐約巨人隊足球迷和西雅圖克拉肯冰球隊的投資者,像ESPN記者在季後賽新聞發佈會上那樣審問Alexa——要求助手深入瞭解單個球員的表現、聯賽排名、球隊歷史等等。Alexa在採訪中表現得還不錯,儘管它的回答遠非完美:當賈西詢問最近一場比賽的結果時,Alexa竟然編造了比分。
儘管如此,賈西似乎對亞馬遜工程師如此迅速地交付一個半功能演示感到非常興奮。參加演示的人回憶説,他大約説了30次“謝謝”。是的,新的改進版Alexa還需要更多的工作。但高管們相信,到2024年初可以實現一個測試版,並在不久之後進行廣泛發佈。
安迪·賈西在2021年西雅圖的GeekWire峯會上。攝影師:大衞·賴德/彭博社然後時間表開始延遲。根據彭博社審查的內部文件,公司曾計劃在10月17日舉行一場盛大的活動,向賈西展示成品。亞馬遜取消了這一計劃,而是舉行了一場較小的發佈會,展示其Kindle電子書閲讀器的新版本。一位熟悉此事的人表示,Alexa AI團隊最近被告知,他們的目標截止日期已推遲到2025年。
亞馬遜未能讓高管接受採訪,但表示其願景仍然是將Alexa打造成為世界上最好的個人助手,並且生成性人工智能代表了改善服務的巨大機會。“我們已經將生成性人工智能整合到Alexa的不同組件中,並在努力大規模實施——在全球已有超過五億個Alexa啓用設備的家庭中——以便為我們的客户提供更主動、更個性化和更可信賴的幫助,”發言人Kristy Schmidt在一份電子郵件聲明中説道。
自Jassy演示以來,Alexa的對話能力有所改善,但參與該項目的頂尖工程師和測試人員表示,這款增強人工智能的助手仍然會用無關或多餘的信息喋喋不休,並且在以前擅長的平凡任務上,如開關燈,仍然表現不佳。
亞馬遜發現自己處於這種境地,客觀上令人震驚。十年前,Alexa定義了一個新興的聽覺硬件類別——智能音箱、電視、平板電腦、相機、汽車配件、微波爐——能夠快速響應口頭請求。
確實,對於許多人來説,Alexa不過是一個被美化的廚房計時器。儘管該公司曾估計超過四分之一的美國家庭擁有至少一個Alexa啓用設備,但它並沒有成為亞馬遜預期的賺錢機器。但如果亞馬遜能夠利用這一覆蓋面,並説服即使是其中一小部分客户為升級版的AlexaGPT付費,這個掙扎中的部門最終可能會盈利,並確保其在一個節儉的機構中的未來。如果亞馬遜未能迎接挑戰,Alexa可能會被視為消費電子歷史上最大的失利之一,與微軟的智能手機失誤相提並論。
一些員工將Alexa的問題歸咎於官僚主義和管理臃腫,而賈西一直試圖消除這些問題。(在9月16日的公司-全員備忘錄中,他批評了不必要的“決策會議的預備會議的預備會議。”)其他內部人士則談到亞馬遜的商業模式存在更深層次的問題,該模式歷史上依賴於維持早期的領先地位,例如Prime、Kindle和賈西在2021年接替傑夫·貝索斯成為首席執行官之前運營了18年的亞馬遜網絡服務巨頭。該公司還以迅速反彈而聞名,憑藉自己的獨立賣家市場超越eBay,或在流媒體視頻領域與Netflix Inc.競爭。即使是Alexa也只是通過超越蘋果公司的Siri而獲勝。
當前和前員工表示,這次不同的是,賈西尚未傳達出一個引人注目的AI驅動的Alexa願景。這些人中的許多人表示,該項目仍需要大量修復,他們對最終產品能否與市場上已經存在的眾多AI應用相媲美並不樂觀。在沒有通常的第一或第二移動優勢的情況下,亞馬遜最好的希望是能夠推出第13個左右的ChatGPT變種。一位曾幫助改善公司電子商務引擎AI的前高級工程師表示,亞馬遜人在貝索斯時代相信他們正在建立一家千年公司。現在,這位工程師表示,感覺亞馬遜正在追趕。
Alexa的誕生源於貝索斯的一個藍天請求:“打造一款20美元的設備,其大腦在雲端,完全由你的聲音控制。”這封郵件是在2011年寫給他的產品領導者的,同年蘋果推出了Siri,這一請求使研究人員踏上了一段奇怪的三年旅程,試圖找出如何聲學檢測特定關鍵詞(例如“Alexa”),以激活機器、識別語音模式並做出相應的回覆。
貝索斯向股東推銷Alexa時稱其為“人工智能助手”,儘管它並不完全是“人工智能”,至少在當前的定義上不是。與ChatGPT、微軟的Copilots和谷歌的Gemini等最先進的人工智能服務能夠進行廣泛的解讀並生成無盡獨特的響應相比,Alexa最初部分基於一種規則系統,該系統將答案邏輯性地映射到上下文相似的問題上。它無法即時寫出一篇論文或分析一個棘手的微積分問題。但無論用户詢問外面的天氣如何、是否預計會下雨,還是是否需要帶傘,Alexa都理解他們可能想要當天的天氣預報。
貝索斯在2011年推出新的Kindle Fire平板電腦。同年,他向副手推銷人工智能助手。攝影師:埃米爾·瓦姆斯特克/Bloomberg這種方法是提升Alexa智商的核心。由於其知識結構存儲在互聯網服務器上,亞馬遜可以不斷為其提供新的數據集和問答模板。最初訓練這個虛擬助手涉及僱傭付費演員在測試揚聲器中朗讀台詞並編寫答案。
最終推出的180美元的亞馬遜Echo是一個黑色圓柱形小工具,約與一個網球罐的高度相當,2014年底發佈時引起了困惑的反應。評論家們從未見過類似的產品。然而,Alexa立即成為熱門,部分原因在於其即時可用性:雖然Siri需要iPhone和按鍵才能使用,但Alexa在一個旨在客廳使用的獨立設備中提供了免提助手。
不久,Echo的銷量超過了一百萬台,而負責Alexa軟件的亞馬遜設備部門正在計劃大量低成本的替代品。這位以節儉著稱的貝索斯如此看好,以至於他給予該部門(到2016年時擁有1000名員工)大量資源和自主權。一位前招聘經理表示,招聘人員被鼓勵告訴在亞馬遜其他部門獲得工作機會的工程師,他們應該加入Alexa團隊。“沒有其他人在做這些,”當時亞馬遜設備負責人戴夫·林普去年對彭博新聞説。“谷歌還沒有發佈任何產品。蘋果也不在這個行業。”
消費者的體驗是如此陌生,以至於亞馬遜提供了奇特的説明,告訴用户如何與Alexa互動。例如,它建議用户讓Alexa播放音樂、閲讀新聞,甚至定義“生命的意義”。當然,Alexa實際上無法對後一個問題進行哲學討論,這個問題是開玩笑的,但工程師可以編程讓它做出一系列有趣的反應,從而賦予它個性。亞馬遜表示,Alexa基於一種意圖預測系統,結合深度學習和自動語言處理來改善服務。
維護和完善Alexa的問答庫是極其勞動密集的。為了改善Alexa的語音識別,亞馬遜僱傭了一支龐大的團隊來轉錄誤解的“發音”的音頻記錄,並手動教Alexa實際説了什麼。與此同時,由一位名叫羅希特·普拉薩德的嚴肅科學家領導的機器學習團隊,繼續擴展到他們所稱的新“領域”,以便Alexa能夠召喚即時體育比分或在機頂盒上搜索電視節目。
羅希特·普拉薩德在2023年9月於阿靈頓的HQ2校園參加亞馬遜設備和服務活動時發言。攝影師:阿爾·德拉戈/彭博社在接下來的幾年裏,林普急於佔領語音市場的任何角落,將Alexa注入到一種幾乎全是廉價硬件的隨意分類中。牀頭的小音箱。語音啓用的燈泡、時鐘和烤箱。在Prime促銷期間,一些Echo的售價低至14.99美元。2019年,林普甚至宣佈推出帶麥克風的眼鏡和指環,以便在外出時與Alexa對話。儘管這些小玩意兒經常以成本價或虧損出售,但一種稱為“下游影響”(Downstream Impact,DSI)的靈活指標為這些開支提供了合理性。客户購買的Alexa設備越多,預計該客户的DSI在未來就會因增加的購物收入(“Alexa,訂購更多紙巾”)或Prime附加服務到音樂流媒體和家庭安全服務而上升。至少這是希望。
這種“意大利麪條牆上扔”的硬件策略找到了立足點,幫助亞馬遜銷售超過1億台Alexa設備。它也給各種軟件工程團隊帶來了麻煩,這些團隊不斷被迫從長期產品路線圖中脱離出來,為各種設備製作定製的禮賓功能和回答模板,三位瞭解情況的人士表示。更糟糕的是,Alexa的僵化思維要求在其伴隨應用程序中進行煩人的手動配置,併為亞馬遜在超級碗廣告中宣傳的更酷查詢提供生硬的語音指令,例如直接從Echo撥打朋友的電話。
Alexa無處不在
亞馬遜將語音助手放入從微波爐到時鐘的所有設備中
來源:來自亞馬遜及其品牌子公司的產品公告和列表彙編的數據。照片:亞馬遜
雖然普拉薩德的團隊確實構建了自動化Alexa學習的工具,但它們在越來越分隔的單元之間進行了大量的微調。一個單元從亞馬遜幾年前從一家專門聚合公共數據的初創公司收購的維基百科式“知識圖譜”中提取答案。另一個則專注於從網絡外包答案,等等,針對更具體的領域。Alexa的“大腦”本質上被切割成分散在全球各地亞馬遜實驗室的多個部分。這種孤立的工作反映在Alexa的響應中:四位熟悉後端流程的人表示,每當提出問題時,Alexa會生成一堆不同的競爭答案,並在瞬間傳達出一個由內部評分驅動的答案,該答案被認為是最相關的。
財務資源和人員數量在一定程度上取決於這些大腦的哪些部分——以及開發它們的團隊——提供了更高比例的答案,這是一場適者生存的競爭。一位前Alexa高管表示,一些單元會每週密切跟蹤領域流量數據,以確保他們的表現不落後於競爭對手,避免被淘汰。這種資源爭奪造成了混亂,這個人説,促使在一個已經以激烈競爭著稱的文化中產生了激烈的競爭。目前尚不清楚這種設置是否對客户有利,還是僅僅對勝利的產品領地有利。亞馬遜表示,它投資於提供最大客户利益的領域,並且其團隊並不以這種方式競爭。該公司還表示,在分配資源時考慮的因素遠不止領域響應量。
到2020年,Alexa的高層開始質疑Alexa的DSI指標的準確性,這些指標並沒有將軟件變成紙面上承諾的盈利業務。儘管該部門擁有約10,000名員工,但這些設備的售價仍然只能讓亞馬遜實現收支平衡,而產生數字收入的嘗試也失敗了。Alexa的互動對於更高級的應用來説實在太笨拙。即使它增加了對第三方開發者的支持,用户可以下載“技能”以獲得定製的語音體驗(瑜伽課程、烹飪食譜、危險邊緣問答等),大多數也只是花招而且是免費的。
亞馬遜自己的收入努力也失敗了。Alexa的一個核心承諾——它將鼓勵消費者用聲音購物——從未流行開來。公司表示,超過一半的Echo用户曾使用這些設備購物,但Alexa的老手警告説,這些統計數據包括了像製作購物清單這樣的步驟。員工表示,隨着世界在Covid-19大流行後重新開放,對DSI的審查加劇,而當購物者回到商店時,亞馬遜的銷售增長放緩。根據兩位熟悉此事的人士,賈西仔細審查了設備業務的財務健康狀況,並對Alexa的指標進行了仔細審視。即使與影響亞馬遜其他業務的更大順風因素隔離,它們仍然令人非常失望。(《華爾街日報》在今年早些時候報道了賈西的財務審查。亞馬遜表示,Alexa面前的機會大於目前在任何資產負債表上所顯示的,並且賈西相信他的團隊在長期業務潛力和創造力方面。)事情需要改變。
在西雅圖的一家亞馬遜生鮮超市內的Alexa自助服務亭。Alexa未能讓人們在家購物。攝影師:大衞·賴德/彭博社2022年11月30日,ChatGPT顛覆了遊戲。OpenAI的聊天機器人使用大型語言模型——這些系統被輸入大量數據,包括書籍、文章和在線評論——以提供用户查詢的最佳響應。這種新架構與Alexa的截然不同,更加智能,具有驚人的對話能力和創造性解決問題的能力。它能夠處理自然對話,甚至可以在沒有預加載響應的情況下,哲學性地討論生命的意義。突然間,亞馬遜感到在人工智能助手方面落後了好幾年。
值得注意的是,OpenAI的發佈並沒有像谷歌那樣引發“紅色警報”時刻,谷歌的高管們立即組織團隊專注於生成性人工智能,意識到對其旗艦搜索引擎的生存威脅。如果説有什麼不同,亞馬遜內部人士表示,反而對這一人工智能飛躍可能對Alexa業務的意義感到巨大興奮。然而,就在兩週前,亞馬遜宣佈裁員數千人,許多裁員針對的是虧損的設備和服務部門。賈西告訴員工,在經濟不確定性面前,他將凍結新的招聘。他們必須以更少的資源做更多的事情。
然後ChatGPT迅速走紅——在幾個月內達到了1億活躍用户——OpenAI在2023年2月推出了每月20美元的高級訂閲。亞馬遜內部對Alexa的重大升級變得更加緊迫。這並不是亞馬遜第一次嘗試開發對話模擬器。2020年,該公司推出了一項名為“Alexa Conversations”的功能,以便能夠進行閒聊,比如電影推薦,而不僅僅是提供從附屬網站IMDB.com抓取的數據。但它仍然是基於模板和可能答案的庫。
亞馬遜表示,它在這個時候開始將早期的大型語言模型(LLM)納入Alexa,包括一個名為“Alexa教師模型”的模型,該模型於2021年部署,以增強其學習能力。工程師們還在嘗試在Alexa現有數據庫上疊加相對原始的模型,尋找使助手更具對話能力的方法。但根據三位熟悉開發的人士的説法,這項工作並不是優先事項,Alexa團隊的許多人甚至對這種調整毫不知情。一位前Alexa產品負責人表示,他們直到ChatGPT推出後才聽説過大型語言模型。
ChatGPT在幾個月內達到了1億活躍用户。攝影師:安德烈·魯達科夫/彭博社當亞馬遜着手開發一個可比的LLM時,如何將Alexa的“大腦”遷移到這個框架上成了一大難題。一些員工打趣説,Alexa與自動電話樹的相似之處多於與人工智能的相似之處。轉向預訓練的AI模型意味着Alexa可以獨立處理無限複雜的問題,但也有可能在基本任務上變得不那麼可靠,例如設置廚房計時器或從接入的數據庫中獲取一次性答案。例如,當賈西在2023年夏天測試Alexa AI原型時,由於它連接的是一個通用語言模型,而不是即時體育信息,因此無法即時提供準確的足球比分。其他為賈西構建AI演示的團隊則嘗試了Meta Platforms Inc.的Llama模型,這些模型比亞馬遜的更先進。
Prasad的團隊從Limp的設備部門分離出來,因此它直接向Jassy報告,不再受制於硬件戰略。(Limp已經離開,負責貝索斯的藍色起源太空項目。)Alexa團隊被賦予了廣泛的任務,構建可以被其他亞馬遜團隊使用的基礎模型,以及可以被雲部門轉售的模型。其雄心的規模通過團隊的新名稱得以明確:人工通用智能。
他們的工作在2023年9月亞馬遜位於弗吉尼亞州阿靈頓的大型新辦公大樓的產品發佈會上揭曉。一次現場對話,使用Jassy私下測試過的同款Echo Show模型,展示了Alexa如何輕鬆地聊起海鷹隊的表現、下一場比賽,推薦燒烤菜單,並製作邀請函發送給朋友。“感覺就像在和一個人交談,”自信的Prasad在台上説道。為了在向公眾推出之前獲得這種新模式的訪問權限,用户需要告訴Alexa“我們聊聊”,它最終會通知他們何時可以體驗。
媒體反應積極,但在亞馬遜內部,越來越明顯的是,2024年初推出的可能性不大。Alexa的響應時間可能很慢,並且在處理AI幻覺方面遇到了問題。參與該項目的兩位人士表示,測試用户的滿意度評分很低——響應聽起來僵硬,並不是很有用——而且Alexa現在在一些智能家居集成方面出現了問題。新的AI架構有時也會過度思考查詢,這讓聽眾感到惱火。前Alexa高管表示,這就像詢問當天的温度,而AI回答“81.0583°。”
普拉薩德,通常是一個穿着整齊、做事有條理的人,在每週的進展會議上表現出緊張的跡象。一位長期合作伙伴表示,優先事項從關於Alexa未來的連貫願景的審慎討論轉變為迫使他的下屬儘快實施新的AI功能。此人表示,他們從未見過普拉薩德如此緊張,並且指導意見通常是“趕快發佈”。亞馬遜表示,在普拉薩德的領導下,Alexa團隊在語音和語言技術方面開創了突破性的進展,並且他是實現公司AI願景的合適領導者。
近年來,Alexa的AI內部測試人員發現其表現遠不如ChatGPT。這些人仍然會審查轉錄以改進Alexa,儘管他們的培訓現在是多方面的。與簡單的問答腳本不同,他們現在正在審查Alexa直覺的多個層面,檢查其對問題的觀察和回應思路,以及答案的質量。對話數據在電子表格中進行跟蹤。
從技術上講,它更聰明,但不一定更明智。一位測試人員表示,持續的幻覺並不總是錯誤的,只是沒有必要,就像Alexa試圖展示其新獲得的能力。例如,以前,如果你問Alexa賈斯汀·汀布萊克和珍妮特·傑克遜在什麼活動中表演了中場秀,它可能會説是2004年超級碗。現在,它同樣可能會給出關於臭名昭著的衣物故障的冗長補充。
另一位測試專家表示,一些提議的查詢——例如要求Alexa幫助撰寫求職信或調試計算機代碼——完全不適合語音助手。這些查詢需要鍵盤和屏幕,而不是免提的Echo。專家猜測這些請求可能來自一個基於應用程序的Alexa版本,可以輸入問題,而不僅僅是口頭提問。無論如何,這位測試人員被指示將回復控制在30秒或更短,以免讓用户感到沮喪。結果就像在評分糟糕的論文,這個人説。
在某些方面,Alexa 追趕 ChatGPT 的最大機會——消費者手中的數百萬設備——也是其最大的負擔。玩弄 ChatGPT 的用户期望它會犯錯誤。如果亞馬遜啓動其 LLM 大腦,Alexa 開始噴出挑釁性的回答,這可能會給 Jassy 帶來災難,因為使用 Echo 硬件的孩子和家庭佔了很大一部分。
雖然亞馬遜一直在開發其 LLM,但一位前 AI 工程師表示,Alexa 團隊最近一直依賴於來自法國 Mistral AI 和位於舊金山的初創公司 Anthropic 的模型,亞馬遜在其中投資了 40 億美元。(亞馬遜表示,沒有單一模型適用於所有用例,其團隊利用通過 AWS 提供的多個 LLM。)Jassy 還挖來了微軟公司產品負責人 Panos Panay,他曾主導軟件製造商的 Windows 硬件和 Surface 筆記本電腦系列,接管亞馬遜的設備團隊。根據兩位熟悉他計劃的人士,他為一個擅長實用小工具的團隊帶來了更高質量設計的關注。
Panos Panay,當時是微軟公司的首席產品官,在 2019 年紐約的一次產品活動上。亞馬遜去年招募了 Panay。攝影師:Mark Kauzlarich/Bloomberg即使 Jassy 推動亞馬遜的工程師迅速將生成 AI 融入更多產品,他也在內部和外部表示,這項技術仍處於早期階段。競爭格局仍在變化。西雅圖的高管們看到,早期將 LLM 驅動的助手與個人設備結合的努力,包括 Humane Inc. 和 Rabbit Inc.,都以失敗告終。蘋果公司,和亞馬遜一樣,並不被視為消費 AI 的領導者,最近才開始將這項技術的元素融入其 iOS 移動平台。更新版的 Siri 可能要到明年才會推出。在此期間,即使新版本的銷售在這個假日季節較為疲軟,iPhone 也不會消失。
但亞馬遜的領導者們意識到,如果有更好的產品出現,人們可能會迅速拔掉Echo,因此他們明白自己可能只有一次機會將Alexa重新介紹給世界,三位接近公司的人士表示。因此,他們暫時按兵不動。自2017年以來,通常用於新Alexa公告的九月份首次過去,卻沒有重大揭示。相反,潘奈在下個月主持了一場新聞發佈會,談到了亞馬遜更新的Kindle系列。
與此同時,去年秋天請求“讓我們聊天”功能的消費者仍在等待與新Alexa AI在他們的Echo上對話。公司此後停止邀請選擇升級的用户,而是建議他們堅持使用基本功能。“你可以問我問題或讓我做一些事情,比如設置計時器、播放音樂、打開連接的燈等,”當被問及聊天時,Alexa現在這樣回應。