谷歌在搜索中注入人工智能,帶來“全新改進”的體驗 - 彭博社
Davey Alba, Julia Love
谷歌正在推出一種新的AI增強搜索體驗,改變了“谷歌”這個詞的含義。
攝影師:Jeff Chiu/AP照片
Noam Shazeer和Daniel de Freitas Adiwardana
攝影師:Winni Wintermeyer/The Washington Post/Getty Images近兩年來,谷歌一直在與OpenAI等公司競爭,以將生成式人工智能引入公眾視野,這種人工智能可以以對話方式回答複雜問題,以一種大多數消費者實際會採用的方式。週二,谷歌向競爭對手發出明確信號,表明它無意失去作為全球最受歡迎搜索引擎的領先地位。
過去二十年來,“谷歌"這個行為一直等同於搜索,現在將通過Alphabet Inc.強大的AI模型Gemini技術得到強化,該公司在加利福尼亞州山景城舉辦的年度開發者大會上宣佈。
“谷歌搜索是以人類好奇心為尺度的生成式人工智能,”首席執行官桑達爾·皮查伊在公司的I/O峯會上宣佈新功能時説。
桑達爾·皮查伊正在用人工智能強化谷歌搜索引擎。攝影師:Andrej Sokolow/picture-alliance/dpa/AP在現場觀眾面前,谷歌推出了皮查稱之為“全新改版的搜索體驗”,這將在本週推出給所有美國用户,而由新的Gemini技術支持的搜索將“很快”推向其他國家。
“我們看到創作者、開發者、初創公司以及每個人面前有很多機會,”皮查在活動前與記者通話時説。
谷歌搜索中最大的單一變化是,現在一些搜索結果將配有“AI概述”,這是一個更具敍事性的回應,使人們免去了點擊各種鏈接的任務。
一個由人工智能驅動的面板將出現在人們查詢的下方,顯示從互聯網上的谷歌搜索結果中提取的摘要信息。谷歌表示,它還將推出一個由人工智能組織的頁面,按主題分組結果,或者提供比如為一週制定飲食計劃或尋找餐廳慶祝週年紀念日等特定任務而求助於谷歌的人的逐日計劃。谷歌表示,對於某些敏感查詢,比如搜索醫療信息或自殘,它不會觸發AI概述。
谷歌的新AI驅動搜索體驗。來源:谷歌1998年成立後不久,谷歌超越雅虎,成為明顯的全球最受歡迎搜索引擎,這是其算法的結果,當時比其他任何東西都更快更準確。其主導地位如此牢不可破,以至於它成為一起聯邦反壟斷訴訟的主題。(預計今年晚些時候將宣判。)
在線搜索的性質正在根本性地改變 — 谷歌的競爭對手越來越多地進入其領域。這家搜索巨頭面臨着來自OpenAI和Anthropic等公司的巨大壓力,它們的人工智能聊天機器人ChatGPT和Claude易於使用,並已被廣泛採納 — 威脅到谷歌在搜索領域的領先地位,危及其整個商業模式。
在週一發佈的戰略性時機公告中,由微軟公司支持的OpenAI推出了一款更快更便宜的AI模型,名為GPT-4o,將為其流行的聊天機器人提供動力。這款新的AI模型將讓人們與ChatGPT交談或向其展示圖像,並且OpenAI表示它可以在毫秒內做出回應。當谷歌在週二發佈其最新產品時,它面臨着一個棘手的平衡行為:展示自己並沒有落後於OpenAI,同時又不破壞搜索廣告業務,這仍然是其命脈。
“通過展示其最新模型以及它們如何為具有強大消費者羣體的現有產品提供動力,谷歌正在展示自己如何有效地區別於競爭對手,” Emarketer的分析師Jacob Bourne説道。“為了保持競爭優勢並滿足投資者,谷歌需要專注於將其人工智能創新轉化為規模化的盈利產品和服務。”
如果去年穀歌展示了願意在其主要產品和服務中嘗試生成式人工智能功能,那麼今年公司正在全力以赴,在其標誌性平台上進行根本性和明顯的變革。
轉變給谷歌核心搜索業務的經濟帶來了挑戰,去年該業務為搜索廣告帶來了超過1750億美元的收入。投資者指出,提供生成式人工智能搜索結果將需要比生成鏈接列表更多的計算能力,可能會侵蝕谷歌極其利潤豐厚的搜索機器的利潤率。在上週接受彭博採訪時,谷歌搜索副總裁麗茲·裏德表示,公司在降低生成式人工智能搜索成本方面取得了進展。她表示,公司沒有計劃讓基於人工智能的新增功能與訂閲掛鈎,這一點已經被媒體報道過。
麗茲·裏德在5月14日于山景城舉行的谷歌I/O活動上發言。攝影師:傑夫·丘/AP照片通過向其搜索引擎引入更多生成式人工智能,谷歌希望減少用户查找所需信息所需的時間和精力負擔,裏德表示。
“搜索是一個非常強大的工具。但有很多時候你必須在搜索中做很多艱苦的工作,”裏德説。“我們如何能夠幫你省去搜索的艱苦工作,讓你可以專注於完成任務?”裏德表示,新的基於人工智能的谷歌搜索將能夠處理數十億個查詢。
但谷歌也必須小心不要攪動局面太多。如果人工智能概述完全回答了用户的問題,人們可能會點擊更少的廣告。依賴搜索巨頭獲取流量的新聞網站和其他網站的生態系統也可能因為谷歌的變化而看到訪問者減少。裏德試圖向廣告商和發佈商展現出一種平靜的氛圍。她表示,廣告將繼續出現在谷歌搜索結果的專用位置中,並通過標籤區分贊助項目和有機結果。與此同時,公司的測試顯示,生成式人工智能搜索是用户訪問其他網站的一個起點,而不是終點,她補充道。
Reid拒絕透露用户會多頻繁看到這些概述,但表示谷歌公司將專注於在傳統搜索體驗之上提供“有意義的價值”時提供它們。
然而,特別是出版商持謹慎態度。幫助數字創作者建立品牌的公司Raptive估計,如果谷歌廣泛推出“搜索生成體驗”(SGE),那麼前往出版商網站的搜索流量將減少25%,就像谷歌週二推出的生成式AI搜索引擎一樣。“通過構建一個旨在將更多流量留在谷歌內部的體驗,將有更少的人訪問個人網站,創作者的收入將受到影響,” Raptive的首席創新官Marc McCollum在一封電子郵件中寫道。“因此,谷歌將獲得份額和收入,而創造了構建SGE所使用的內容的人們將受到折磨。”
谷歌位於加利福尼亞州山景城的Bay View校園。谷歌與搜索已經超過兩十年。攝影師:David Paul Morris/Bloomberg谷歌高管強調,在人工智能新時代,搜索仍將是核心。例如,Reid描述了一個即將推出的“視覺搜索”功能,該功能將允許人們在谷歌的自願參與搜索實驗中拍攝一個故障的小工具的視頻,比如唱片播放機,並要求谷歌提供AI概述來幫助他們解決問題。
在週一與記者通話時,谷歌AI實驗室DeepMind的首席執行官Demis Hassabis更進一步展示了Gemini對查詢的響應能力。Hassabis展示了Project Astra,這是一個能夠實時處理視頻並回應的AI助手的原型。在一個預先錄製的視頻演示中,一名員工在辦公室裏走動,助手利用手機攝像頭“看到”,回答了有關場景中有什麼的問題。該程序正確回答了一個關於辦公室位於倫敦哪個街區的問題,基於窗外的景色,並告訴員工她把眼鏡放在哪裏了。Hassabis表示該視頻是“一次拍攝,實時捕捉的。”
“在任何時刻,我們都在處理不同的感官信息流,理解並做出決策,”Hassabis在Project Astra演示中説道。“想象一下,代理可以看到和聽到我們所看到和聽到的內容,以更好地理解我們所處的環境,並在對話中快速做出回應,使互動的節奏和質量感覺更加自然。” Pichai後來澄清説,Google“有志”地希望將Project Astra的一些功能帶入公司的核心產品,特別是Gemini,在今年下半年。
為了在人工智能領域不斷取得進展,Google還不得不更新其一套AI模型,並且該公司在這方面分享了更多進展。它宣佈了Gemini 1.5 Flash,Google表示這是通過其應用程序編程接口(API)提供的最快的AI模型,通常由程序員用於自動化高頻任務,如總結文本、給圖像或視頻加標題,或從表格中提取數據。
它還揭示了Gemini Nano的更新,Google最小的AI模型,擴展到包括圖像在內的文本輸入;推出了一個更新版本的其開放模型系列Gemini 2,具有更高的效率;並表示該公司在其強大的AI模型Gemini 1.5 Pro上取得了更好的基準。
週二,Google確認開發人員可以使用Gemini 1.5 Pro同時處理更多文本、視頻和音頻 — 高達2百萬個“標記”,或內容片段。這相當於約2小時的視頻、22小時的音頻或超過140萬字。Google表示,這種處理量遠遠超過其他競爭對手的AI模型,包括OpenAI。
谷歌還突出了其生成式媒體工具和服務,介紹了新模型並更新了現有模型。週二,它宣佈推出了一個名為Veo的新視頻生成模型,生成高質量的視頻,時長超過一分鐘 — 這是對OpenAI的視頻生成工具Sora的回應。谷歌正在讓創作者註冊加入等待測試該產品的名單,並表示將在“未來”將Veo的部分功能引入YouTube Shorts和其他視頻產品中。
谷歌宣佈了Imagen 3的更新,這是其文本轉圖像AI模型的第三個版本,其中包括減少圖像失真等改進。此外,谷歌還在繼續嘗試使用名為Lyria的AI生成音樂服務,以及一套名為音樂AI沙盒的音樂AI工具。
AI優勢的很大一部分取決於擁有能夠處理所有正在處理的數據的強大半導體。為此,谷歌宣佈推出了面向數據中心的自家設計芯片的新版本,即其TPU(張量處理單元)的第六個版本。谷歌表示,最新版本將比其前身快4.7倍,具有更多內存訪問權限,並具有更快的與其他芯片連接的功能。
在人們對公司應該如何處理AI生成內容的浪潮以及對版權問題的擔憂不斷增長的情況下,谷歌表示將推出由Gemini和視頻模型Veo創建的水印系統。該系統名為SynthID,將不可察覺的數字標籤嵌入AI生成的圖像、音頻、視頻甚至文本中,以便人們可以追蹤特定媒體內容的來源。谷歌計劃在今年夏天以開源形式發佈這項技術,以便外部開發人員使用。
谷歌還試圖將Gemini描繪為一個強大的代理,可以在用户日常生活中提供幫助。為了每月支付20美元購買谷歌的AI高級訂閲計劃的用户將獲得Gemini的一個版本,可以一次處理100萬個標記 — 或者大約70萬個單詞,谷歌表示這是目前向廣大公眾提供的任何模型中最大的。公司表示,這意味着人們可以要求AI模型為他們消化大量數據,比如總結100封電子郵件。一項名為Gemini Live的新功能將讓谷歌的高級訂閲用户在其移動設備上自然地與公司的AI軟件交流,甚至可以在回答過程中暫停或打斷Gemini Live並提出問題。
谷歌表示,人們的文件將保持私密,不會用於訓練AI模型。訂閲用户將能夠創建Gemini的定製版本,稱為Gems,以實現特定目的,比如指導他們的跑步。
Character.AI的聯合創始人將加入谷歌,這是一項更大的交易,允許這家搜索巨頭獲得這家人工智能初創公司的技術許可。
Character.AI是一家以能夠模仿任何人或任何事物的聊天機器人而聞名的初創公司,週五在一篇博客文章中宣佈了這一消息。創始人Noam Shazeer和Daniel De Freitas以及其研究團隊的一些成員將加入Alphabet Inc.的谷歌,該公司表示。這家初創公司的新臨時首席執行官將是Dominic Perella,他曾擔任Character.AI的總法律顧問。