Google兵法,如何反殺微軟和OpenAI?_風聞
BImpact-宇婷,To B行业观察者、资深媒体人、博主。-1小时前

今年初,OpenAI的崛起似乎預示着Google的厄運。但這家科技巨頭已經平息了其AI研究人員之間的爭吵,並且終於以其最新的AI技術Gemini開始進攻。現在,困難的部分開始了。
發佈備受期待的新人工智能技術Gemini的第一個版本,這幾乎是在一年前一些批評人士預測OpenAI的ChatGPT可能會擊敗谷歌在搜索領域的主導地位之後的事情。谷歌的領導層成功地讓公司內部的不同派系開始合作,以應對OpenAI,這違背了那些認為谷歌已經變得過於優柔寡斷和官僚主義的人的看法。谷歌在搜索領域的主導地位依然保持完整。而且,谷歌的股價今年大幅上漲。
現在,艱難的工作開始了。在接下來的幾個月裏,谷歌將不得不展示如何將其統稱為Gemini的AI模型整合到其產品中,而不損害現有的業務,比如搜索。
據知情人士透露,谷歌已經將Gemini的一個較低級版本集成到了Bard中,Bard是谷歌創建的與ChatGPT競爭的聊天機器人,但迄今為止使用有限。在未來,谷歌計劃在幾乎所有產品線上使用Gemini,從搜索引擎到生產力應用,以及一款名為Pixie的AI助手,該助手將僅限於其Pixel設備。據一位瞭解內部討論的人士透露,產品還可能包括可穿戴設備,比如眼鏡,可以利用AI的能力識別佩戴者所見的物體。然後,該設備可以為他們提供建議,例如如何使用工具、解決數學問題或演奏樂器。
谷歌在與監管機構謹慎地協商的同時必須完成所有這些工作。該公司正捲入兩起聯邦反壟斷訴訟,涉及其搜索引擎和廣告業務的主導地位。反壟斷官員密切關注谷歌的AI工作,因為這可能成為谷歌如何利用其在一個領域的主導地位贏得另一個領域的例子,即利用其搜索索引中的網站數據以及數十億用户的數據來訓練新的AI。
AI的成功對於谷歌的雲業務也至關重要,因為對於這些服務而言,對於計算需求量大的AI模型的需求日益增加。微軟已經報告稱其雲業務的增長超過了谷歌和亞馬遜。
雖然ChatGPT以其對話式AI而聞名,但它背後的技術在商業界已經證明了其有用性,用途包括自動化客户服務和軟件編碼、快速生成營銷活動以及幫助華爾街公司理解大量數據。對於谷歌來説,問題在於OpenAI和微軟在向消費者和企業銷售這項技術方面已經具有很大的先發優勢,這使他們獲得了有價值的數據和反饋,可以用來改進產品。
“關鍵在於實際效果-人們能夠用它構建什麼。我們只是剛剛開始看到這一點,“Madrona Venture Group的合夥人Jon Turow説。他之前在亞馬遜網絡服務公司負責AI產品。“但我們已經看到的是令人矚目的。”
Gemini是該公司25年歷史上最重要的嘗試之一。隨着谷歌步入中年,其核心廣告業務仍然產生鉅額利潤,這些利潤為其母公司Alphabet在自動駕駛汽車、健康再保險和生物技術等新業務上的一系列賭注提供了資金支持。但是,這些十年前的賭注都沒有奏效。
因此,投資者越來越迫切地要求谷歌領導層削減這個擁有18.2萬員工的公司的成本,導致今年發生了大規模裁員,這對員工士氣造成了傷害。員工們正在為新的一年做好更多裁員的準備,儘管目前尚不清楚它們是否會面向全體員工,還是針對特定的團隊。
AI是另一個需要公司大量資金支持的賭注,用於支付從人員到硬件的一切費用。據與Gemini團隊關係密切的人士透露,谷歌需要大量投資來防止其AI團隊因OpenAI向谷歌的工程師和研究人員提供數百萬美元的薪資套餐而出走。
谷歌還希望消除這樣一個觀念:它除了從幾十年前的創新中獲益之外,幾乎沒有做出任何貢獻。多年來,該公司通過兩個獨立的部門,Google Brain和DeepMind,投入了大量資金進行AI研究。它甚至發明了稱為transformers的基礎技術,這是OpenAI創建的AI模型系列GPT的核心。
但是,OpenAI的驚人崛起引發了谷歌可能會像其他許多古老的技術巨頭一樣在技術領域失利的擔憂。公司內部的高管們對此感到特別惱火,因為據一位直接瞭解他們討論的人士透露,曾經笨拙的科技巨頭微軟在今年2月將ChatGPT納入其Bing搜索引擎中。
谷歌發言人對此事沒有置評。
戰鬥實驗室
多年來,Google和Alphabet的CEO Sundar Pichai一直向同事們抱怨,他無法讓他的兩個人工智能研究單位合作。Google在2014年收購的DeepMind的CEO Demis Hassabis長期堅持認為,公司應該獨立於母公司,這種安排可以更好地追求其發展人工通用智能(類似人類的人工智能)的目標。
與此同時,DeepMind的姊妹單位Google Brain專注於在Google的產品中實施的研究,孵化了機器學習的重要進展,如Transformer,這一發明為Google和其他公司訓練更復雜的模型鋪平了道路。該團隊由Jeff Dean領導,他是一位經驗豐富的工程師,他在Google早期的編碼工作幫助其搜索引擎規模擴大到數十億用户。
這兩個單位之間的分離非常深入。Google Brain總部位於加利福尼亞州山景城,Google的總部,而Hassabis和他的團隊則在倫敦國王十字車站附近的主要辦公室運營DeepMind。
隨着DeepMind規模的擴大,DeepMind竭盡所能避免與Google Brain合作,根據一位在那裏工作過的人的説法,例如,通過明顯地在Google Brain當時沒有主要存在的城市(如巴黎和阿爾伯塔省埃德蒙頓)開設辦事處。DeepMind的研究人員可以訪問在Google Brain編寫的代碼,但反之則不行,一些員工認為這是DeepMind過分保密的跡象,即使在Google員工中也是如此。當Hassabis想要採取措施保護DeepMind的獨立性時,他會直接與共同創始人Larry Page交流,Larry Page領導了收購併擁有Alphabet的控股權,與共同創始人Sergey Brin並駕齊驅。
隨着時間的推移,Hassabis希望將DeepMind與Google完全分離開來,因為他越來越擔心這個龐大的公司將如何使用這項技術,包括將其銷售給軍方,一位知情人士説。他構想了創建一家擁有DeepMind知識產權的獨立公司的想法。然而,2021年,Hassabis告訴DeepMind的員工,與Google分離的努力(他稱之為Mario計劃)已經結束,因為Pichai承諾為該團隊提供更多資金,包括用於人工智能倫理的資金,一位知情人士説。

英國首相Rishi Sunak(左)和Google的Demis Hassabis在6月份的倫敦。照片由Carlos Jasso / Bloomberg通過Getty提供
多年來,兩個團隊之間的資源競爭加劇了緊張局勢。Google只有有限數量的服務器芯片可供其人工智能研究人員使用。隨着人工智能在整個行業引起的狂熱增加對芯片的需求,這些芯片變得更加稀缺。
與此同時,隨着Google高管深陷內部政治之中,該公司的知名人工智能研究人員開始離職。其中一些人成立了自己的公司,對Google的官僚文化感到沮喪,在OpenAI推出其版本之前,Google阻止了類似ChatGPT的服務的發佈。其他人則被OpenAI收購,這是一家由Elon Musk和其他知名人士於2015年創立的非營利性初創公司,部分原因是他們擔心Google將擁有未來的人工智能。OpenAI的創始人之一是Ilya Sutskever,他是一位關鍵的Google Brain工程師,他領導了諸如創建能夠推理解決之前未遇到的問題的人工智能等進展。
然而,當OpenAI於去年11月發佈ChatGPT時,公眾的反應震驚了Google。這家有400名員工的初創公司竟然在推出一個能夠令人信服地回答各種問題的聊天機器人方面超過了Google,這對該公司的競爭力提出了質疑。
儘管如此,一些Google領導似乎對這個新的互聯網寵兒毫不在意。在ChatGPT發佈幾周後的一次員工會議上,Dean在回答有關聊天機器人的問題時表示,Google不僅僅是對其他初創企業的反應,一位知情人士説。
但到了2月份,微軟宣佈將在其Bing搜索引擎中實施ChatGPT。一些投資者提出的聊天機器人可能侵蝕Google搜索霸主地位的觀點讓其高管們感到不安。
頭腦的合併
Google需要馬上採取行動。
它提出的一個解決方案是Bard,在幾個月內將其拼湊起來,並在三月份發佈了這個聊天機器人。在Google內部,這一努力引起了轟動,一位知名的Google研究員Jacob Devlin在向Pichai和其他高級執行官提出了對Google使用ChatGPT數據來訓練AI模型的擔憂後,他離開了公司。他隨即加入了OpenAI,但僅僅幾個月後,他又回到了Google,具體原因不詳。
Google的另一個回應是最終結束DeepMind和Google Brain之間的內部競爭。Google從這兩個團隊中挑選研究人員來構建一個新模型:Gemini,由Dean和高級DeepMind研究員Oriol Vinyals領導的一個項目。之前,Vinyals曾在Brain與Dean共事。
然後,在四月份,Google宣佈將Brain和DeepMind合併。Hassabis接管了這個新實體,Google DeepMind,而Dean則退居Google的首席科學家。這一舉動對許多Google工程師來説是個震驚,他們認為鑑於Dean的成就和與公司的長期歷史,他應該成為該單位的領導者。

Google的Jeff Dean在2020年。照片由David Paul Morris / Bloomberg通過Getty提供
領導層試圖將合併銷售為合併單元的勝利。Google Brain研究副總裁Zoubin Ghahramani訪問了DeepMind位於倫敦的辦公室,向員工解釋了重組的情況,並在這一變化宣佈的那周的城鎮大會上。Google Brain為自己的員工召開了一次獨立的會議。Hassabis告訴員工,Google DeepMind將彙集世界上兩個最好的AI研究團隊。
但是Google的AI員工很快意識到優先事項也在發生變化。Google DeepMind的領導層減少了對不關鍵於構建競爭性AI產品的研究項目的投入。據這些人説,失去資源的項目包括計劃中的多模型模型Gato的續集和一個名為GenRL的研究團隊,該團隊構建了能夠在虛擬環境中導航的AI系統,例如Atari遊戲。
高管們表示,這些變化還帶來了額外的好處:減少了重疊努力和削減了低優先級項目,意味着員工將不再為實驗和研究的芯片訪問而爭鬥。
在Mountain View,AI員工曾分散在公司校園的多個建築物中,他們搬進了位於校園核心的單個辦公室,目的是改善研究人員之間的合作。
當OpenAI爆發性增長的衝擊消退時,Google終於有機會反擊。
一個秘密武器
然而,Google面臨着一個巨大的障礙:構建一個優於GPT-4的模型。
從一開始,這意味着研究人員必須在模型開發中達到里程碑的激進截止日期。據一位瞭解該工作的人士透露,員工們為了滿足緊迫的時間表而日夜工作,這種自上而下的方法與Google以前對其研究實驗室的不干預方式有着明顯的不同。一位接近該工作的人士表示,對一些人來説,每週工作80小時變得很常見。
即使在公司的AI組織之外,Google的員工也被期望迅速掌握這項技術。根據兩位知情人士的瞭解,整年,Google Cloud通過要求員工通過在該主題上進行考試來提高他們對AI的瞭解,為非技術角色(如銷售)提供額外的材料。
Google的目標是通過使Gemini能夠理解各種不同的媒體(包括文本,圖像,視頻和音頻),從而獲得對OpenAI的優勢,以便AI可以用簡單的英語解釋並解釋複雜圖表的內容。Pichai後來表示,Gemini將從頭開始對這些類型的數據進行訓練。Pichai非常清楚,OpenAI在3月份宣佈了類似的圖像識別能力,但最初並未廣泛提供這些功能。這給了Google在OpenAI之前發佈了一套廣泛的多模態功能的機會。
Google擁有一個秘密武器:YouTube。據兩位知情人士透露,Google的研究人員大量依賴這一屬於Google的流媒體服務的數據,包括圖像,視頻和音頻字幕文本,這對於訓練AI模型至關重要。
這使得Google能夠訪問比OpenAI和圖像生成初創公司Midjourney等競爭對手更豐富的信息庫。這也意味着Google必須滿足法務部門的要求,例如確保如果YouTube用户刪除了視頻,Google也會從其模型使用的數據集中刪除該內容。
Google的另一個優勢是計算能力。與依靠微軟服務器的OpenAI不同,Google擁有自己的數據中心。它甚至建立了自己的專用AI芯片,張量處理單元(TPU),以更高效地運行其軟件。為了Gemini項目,它已經積累了大量這些芯片——77,000個第四代TPU,代號Pufferfish。在第三季度,Google的未分配企業成本,包括對DeepMind的支出,躍升近40%,達到16億美元。
通過與負責項目各個部分的員工進行每日會議,Gemini的領導層密切關注研究人員的進展。這些會議在倫敦的員工結束一天和Mountain View的員工開始一天時舉行。據一位知情人士透露,主持會議的人包括Dean,Vinyals和研究副總裁Koray Kavukcuoglu。

Google的位於加利福尼亞山景城的總部。照片:華盛頓郵報通過蓋蒂圖片社/Melina Mara
高級執行人員也親自參與其中。迪恩負責改進軟件,幫助公司的算法處理大量數據。聯合創始人布林通常與谷歌保持距離,但在山景城與吉米尼研究人員並肩工作,並經常與他們一起在公司的自助餐廳吃午餐。
在過程中,發生了一些尷尬的時刻。在二月份巴德的發佈演示中,聊天機器人關於詹姆斯·韋伯太空望遠鏡出現了事實錯誤,這讓谷歌感到尷尬,就在它試圖趕上OpenAI的時候。當這個錯誤廣為人知時,谷歌的股價在兩天後下跌了高達9%。
五月份,谷歌首次在年度開發者大會上披露了吉米尼的存在。其中一位分析師對此印象深刻:當天該公司的股價上漲了超過4%。
做好競爭準備
接下來幾個月,谷歌逐漸接近發佈吉米尼。九月份,它向一些開發者提供了一個較小版本的吉米尼供測試。
但是在同一個月,OpenAI在多模式功能方面率先推出了帶有視覺功能的GPT-4,這為其技術和新業務帶來了更多關注。據一位接近團隊的人士透露,巴德的用户使用情況令一些高管內部感到失望。谷歌十月份披露了其雲計算部門第三季度收入增長僅為22%,而微軟則在同一天宣佈其Azure雲計算部門收入增長了29%。這隻增加了對吉米尼團隊提出大規模創新的壓力。
然後,在十一月左右,在對新產品進行高管審查時,最先進的吉米尼模型在除英語以外的其他語言中運行效果不佳。
OpenAI自身也面臨問題,這是一個小小的安慰。2023年年中,OpenAI放棄了一個名為阿拉基斯的重要新模型,因為其訓練效果不佳。十一月底,OpenAI的董事會解僱了首席執行官薩姆·奧爾特曼,幾乎使公司陷入崩潰。奧爾特曼在此事件後重返OpenAI,目前似乎穩定了局面。
最後,在十二月初,谷歌揭開了吉米尼的面紗。它公佈了測試結果,顯示最強版本的吉米尼——吉米尼超級版,在許多行業標準基準測試中勝過了GPT-4,儘管許多研究人員對這些説法提出了質疑。在這次引人注目的發佈中,最大的污點是谷歌的一段營銷視頻,根據谷歌自己的説法,誇大了吉米尼的能力。這段視頻的發佈讓公司的一些普通員工感到沮喪,因為他們事先沒有看到。但是一系列的公告傳達了一個強烈的信息:谷歌已經準備好競爭。
一位高管甚至對微軟進行了攻擊,指責其依賴OpenAI開發尖端技術。谷歌和Alphabet全球事務總裁肯特·沃克在一場由新聞機構Semafor主辦的活動中表示,公司“不相信外包”其人工智能開發。
現在,谷歌的考驗是將吉米尼引入其產品組合的各個部分,就像微軟利用OpenAI的技術一樣。但是它有一個競爭對手沒有的優勢:一系列的Pixel硬件設備,包括手機、手錶和耳機,可以從人工智能中受益。吉米尼的一個版本專門設計用於Pixel手機上,Pixel手機使用了谷歌定製的人工智能芯片。
Pixie是一個專為Pixel設備開發的人工智能助手,可以在科技公司競相將硬件與新的人工智能能力整合的時代,提升谷歌的硬件業務。據瞭解該項目的消息人士稱,Pixie將利用客户手機上的信息,包括來自谷歌產品(如地圖和Gmail)的數據,演變成更加個性化的Google助手版本。這個功能可能會在明年與Pixel 9和9 Pro一起推出。
最終,谷歌希望將這些功能帶到其低端手機和手錶等設備上。公司需要更加複雜的模型來支持所有產品的創意。但是它似乎正在竭力確保不再被措手不及。據一位知情人士透露,谷歌已經在培訓其下一個重大模型——吉米尼2。
Amir Efrati也為本文做出了貢獻。