谷歌打響全面反擊戰！官宣AI重構搜索、新模型比肩GPT-4_風聞

量子位-量子位官方账号-05-11 06:09

2023-05-11

明敏豐色發自凹非寺

量子位 | 公眾號 QbitAI

萬眾矚目，谷歌的反擊來了。

現在，谷歌搜索終於要加入AI對話功能了，排隊通道已經開放。

當然這還只是第一步。

大的還在後面：

全新大語言模型PaLM 2正式亮相，谷歌聲稱它在部分任務超越GPT-4。

Bard能力大更新，不用再排隊等候，並支持新語言。

谷歌版AI辦公助手也一併推出，將在Gmail中搶先亮相。

谷歌雲也上線多個基礎大模型，為行業提供更進一步的生成式AI服務……

在最新一屆I/O開發者大會上，谷歌的大放送真的太震撼。

有網友直呼：

AI大戰全面開啓。

有人甚至表示：

現在我後悔為ChatGPT付費了。

一場發佈會結束，谷歌股價上漲超4%。

PaLM 2部分任務超越GPT-4

毫無疑問，PaLM 2是今年I/O大會的重中之重，由皮查伊親自做介紹。

目前的Bard以及谷歌超過25個AI產品和功能，現在都由PaLM 2作為底層技術支持。

作為谷歌目前最先進的大模型，PaLM 2基於Pathways架構，是PaLM的升級版，通過JAX在TPU v4上構建。

據介紹，PaLM 2接受了100多種語言的訓練，這使得它在語言理解、生成和翻譯上的能力更強，並且會更加擅長常識推理、數學邏輯分析。

谷歌表示，PaLM 2的數據集中有海量論文和網頁，其中包含非常多數學表達式。在這些數據的訓練後，PaLM 2能輕鬆解決數學問題，甚至是製作圖表。

編程方面，PaLM 2現在支持20種編程語言，如Python、JavaScript等常用語言，以及Prolog、Fortran和Verilog等。

這一次谷歌一併推出了四種不同size的PaLM 2。

他們用不同的動物來體現規模大小。最小的是“壁虎”，最大的是“獨角獸”。

其中“壁虎”版本是非常輕量級的，能在移動設備上快速運行，包括離線狀態；每秒可處理20個token。

DeepMind副總裁在I/O大會前的新聞發佈會上表示：

我們發現模型並不總是越大越好，這也是為什麼我們決定提供一系列不同規模的模型。

這意味着微調PaLM 2會更加方便，由此它也能支持更多產品和應用。

在I/O大會上，谷歌就宣佈了現在已經有超過25個產品和應用正在使用PaLM 2的能力。

具體的表現形式，就是Duet AI。

可以將它理解為微軟365 Copilot的對標產品，是一個能夠內嵌在各種辦公軟件中的AI助手。

谷歌在發佈會現場已經展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。

包括根據提示補充郵件內容、生成PPT、根據提示生成圖片素材、一鍵生成表格等。

同樣，這個AI助手也能提供編程幫助。基於谷歌雲，它能實時推薦、糾錯代碼塊，並且以對話方式解答編程問題，目前支持Go、JavaScript、Python和SQL。

另外基於PaLM 2，谷歌還推出了一些專業領域大模型。

谷歌的健康團隊打造了Med-PaLM 2。它能回答各種醫學問題，據稱是首個在美國醫療執照考試中達到專家水平的大語言模型。

目前谷歌正在嘗試讓它具備多模態能力，比如自己檢查X光片後給出診斷。在今年夏天晚些時候，這個模型將對一小部分谷歌雲用户開放。

另一個專業大模型是Sec-PaLM 2。

這是一個面向網絡安全維護的大模型，它能分析和解釋潛在的惡意腳本，並檢測腳本的危險性。

那麼，在展示了PaLM 2一眾卓越能力後，就該聊聊怎麼開放使用了。

谷歌表示，現在可以通過PaLM API接口、Firebase和Colab使用PaLM 2。

Bard全面開放，支持圖片、集成自家地圖等應用

對標ChatGPT的Bard終於取消排隊試用，在全球180+國家和地區進行全面開放了。

新增黑暗模式，備受程序員好評：（手動狗頭）

除了擴大訪問範圍，Bard也在英文之外，新增直接用日語和韓語對話的功能。中文看起來還得再等下一波——谷歌表示，很快就會新增到40種語言版本。

由於從今天起，Bard將全面接入PaLM 2，所以它在編程和推理上面的能力也有了很大的提升，代碼生成、調試和解釋都更加專業（獲得程序員認可的那種）。

當你讓它用python寫一段國際象棋中的“四步殺”（scholar’s mate）招式，裏面參考了別的代碼，它會給出相關鏈接，方便你查看。

你可以就它給出代碼中某個不懂的函數進行進一步提問，問它能否再改善一下，或者是要求它將所有內容都合併的一個代碼塊中。

不過，最驚喜的當屬應廣大開發者要求，加入了一鍵導入功能。

現在，你可以將Bard生成的代碼直接導出到Colab。

除了代碼，你用Bard生成的任何內容，比如電子郵件草稿、表格什麼的也都可以直接拖到Gmail、Docs和Sheets中。

對了，Bard現在的回答中也支持圖片了。拿來問旅遊攻略最方便不過：

除了它能用圖片回答你，你也能直接丟給它圖片，比如上傳一張兩隻狗狗的照片，讓它來幫你編點好玩的故事：

這個功能由Google Lens（一款能讓機器學會“看圖説話”的AI應用）提供支持。

除了Google Lens，Docs、Drive、Gmail、地圖等多個谷歌自家的應用能力也整合到了Bard之中。

比如在Bard的回答中直接用谷歌地圖查看幾所大學的地理位置：

有種現在要用谷歌的各種產品，只用Bard一個入口就夠了的感覺。

除了自家應用，Bard這次還把Adobe Firefly給搬了上來，各種有版權的創意圖像用對話就可以“信手拈來”：

搜索重構，加入AI對話

千呼萬呼，谷歌搜索終於開啓了AI對話的能力。

“一家帶有一個不到3歲孩子和一隻狗的家庭來説，去布萊斯峽谷還是拱門國家公園遊玩更好？”

對於這個問題，擱以前，你可能需要自己把它拆成各種小問題去搜索引擎整理大量信息，最終才能找到答案。

現在谷歌讓你儘量一步到位。

如圖所示，谷歌搜索沒有簡單地搬運搜出來的答案，而是將孩子和狗這兩個因素都考慮進去給出整理後的回答，比如它説：

布萊斯峽谷有兩條狗能進入的環路，對嬰兒車也十分友好；拱門國家公園則大部分路段都不允許寵物進入；兩個地方都要求寵物拴上皮帶等。

每句話都有具體的依據鏈接供查看：

除此之外，它還會顯示了來自不同網站網友發佈的攻略鏈接。

最重要的是，你可以對它的回答進行進一步對話式的提問，點擊“ask for a follow up”按鈕即可。

用新的谷歌搜索進行購物也非常有趣，它號稱可以幫你迅速做出理性的購買決定。

比如當你想要一輛“適合5英里山地通勤的自行車”，它會先告訴你挑選之前需要考慮的重要因素，比如：

一看設計：電動自行車、公路自行車和混合動力自行車等適合通勤；

二看電機和電池，三看減震用的懸架，有山路的通勤需要應對裂紋和顛簸帶來的衝擊等。

然後再給你推薦合適的車，推薦時還會給出具體產品説明、最新評價、價格和圖片等全面信息。

你也可以進行進一步提問，比如只要紅色電動自行車，它會進一步優化回答。

這個功能由谷歌的購物比價產品Shopping Graph提供支持，它可以蒐集並不斷更新來自全世界的產品列表。

值得一提的是，谷歌直言更新後的AI搜索界面照樣會植入廣告，但放心：它只會在專用廣告位中出現，不會混進你的搜索結果中。

最後，這個新功能目前還只能在谷歌Search Labs中申請試用，且僅限美國地區的用户體驗。

三大基礎模型上線谷歌雲

今年I/O大會，谷歌雲的內容也同樣搶眼。

在更新了一大波AI能力後，谷歌為自家雲端機器學習平台Vertex AI，上新了三款大模型：

Codey：text-to-code，幫助程序員寫代碼

Imagen：text-to-image，生成高質量圖像

Chirp：speech-to-text，方便溝通

這三種模型的能力其實在今天的發佈會上都有展示過，比如生成代碼、谷歌照片智能編輯等。

除此之外，在Vertex AI上現在還能使用文本和圖像的嵌入式API。它支持將文本和圖像數據轉換為多維數值向量、映射語義關係，從而允許開發者創建出更加有意思的應用。

另一個重大更新則在RLHF上，谷歌表示他們是首個將此功能作為託管服務放到端到端機器學習平台行的。好處是能讓企業結合RLHF快速訓練獎勵模型，用於微調基礎模型，這對於大模型在行業應用中的準確性提升非常關鍵。

除了模型方面，谷歌雲在訓練上還推出了下一代A3 GPU超算。通過將A3虛擬機和Nvidia H100結合，谷歌雲能夠提供更大的計算吞吐量和帶寬，能夠讓企業更快開發機器學習模型。

除了這些，谷歌這次還帶來售價1799美元（合人民幣約1萬2）的首款摺疊屏手機等新硬件產品，以及接入AI功能的Android 14系統（比如提供信息回覆建議什麼的），這裏就不一一展示了。

總的來看，作為第15屆I/O大會，谷歌這次着實給大家帶來了非常多的乾貨。

值得一提的是，這次上台介紹的發言嘉賓，已不見Jeff Dean的身影，他前幾日剛剛宣佈離職。

作為從前Google AI最代表性發言的高管，在AI 2.0浪潮裏，將何在？

沒有了這位巨人的加持，谷歌是否還能在大模型和AI搜索領域中奮起追上，值得期待。

你對這次谷歌的發佈，滿意嗎？