谷歌的Gemini：ChatGPT比較，人工智能能力，開發者訪問 - 彭博社

Davey Alba, Shirin Ghaffary

2023-12-06

Alphabet Inc.的谷歌發明了支撐當前人工智能熱潮的技術，但其產品在流行度上落後。這家搜索巨頭希望通過備受期待的Gemini發佈來改變這一狀況，這是公司迄今構建的“最大、最有能力的AI模型”。

自從OpenAI去年推出了具有話語聊天機器人ChatGPT的轟動成功以來，越來越多的公司開始嘗試生成式人工智能，這種技術可以根據用户的要求自動完成編碼、總結報告或創建營銷活動等任務。在產品週三發佈之前的一次演示中，谷歌強調Gemini是其迄今為止最靈活的模型，因為它有不同的尺寸，包括可以直接在智能手機上運行的版本。這使該程序與其他競爭對手有所區別。

這種人工智能模型是一種用於支撐各種生成式人工智能應用的系統，將有三個版本。它們分別是Gemini Ultra、Gemini Pro和Gemini Nano。谷歌DeepMind的產品副總裁Eli Collins表示，這種多樣性意味着Gemini“能夠在從移動設備到大規模數據中心的各種設備上運行。”

“長期以來，我們一直希望構建一代新的人工智能模型，受到人們理解和與世界互動方式的啓發——一種更像是有幫助的合作者，而不是聰明的軟件。”Collins在與記者通話時表示。“Gemini讓我們離這個願景更近了一步。”

在該模型發佈之前，公司對Gemini進行了一系列標準行業基準測試，並表示在八項測試中，Gemini Pro在六項中超過了OpenAI的GPT-3.5模型。谷歌表示，Gemini還在對通用語言理解、推理、數學和編碼進行的八項基準測試中，超過了OpenAI最新版本GPT-4的七項。與此同時，谷歌估計，該公司最新的生成式人工智能產品AlphaCode 2能夠解釋和生成代碼，在競爭性編程領域超過了85%的競爭對手。該公司將發佈一份技術報告，更深入地解釋Gemini的模型架構、訓練過程和評估。

從星期三開始，想要為智能手機和平板電腦構建Gemini驅動應用程序的Android開發人員將能夠註冊使用“納米”版本的AI模型，該模型可以直接在這些設備上運行。谷歌還表示，它立即在其旗艦手機Pixel 8 Pro上啓用了Gemini，它將為新的生成式AI功能提供動力，比如能夠總結錄音電話對話中的要點。下週，谷歌將通過其Vertex AI和AI Studio平台向雲客户提供Gemini Pro，該公司表示。

谷歌的AI模型Gemini Ultra將首先在開發人員和企業公司的早期訪問計劃中提供，有關該計劃的詳細信息將在下週公佈。它將在明年初向公眾更廣泛地推出。

Gemini還將能夠通過Bard與谷歌龐大的應用程序和服務進行集成——Bard是該公司的對話聊天機器人，也是OpenAI的ChatGPT的競爭對手。此前，Bard使用了谷歌的PaLM 2模型，這是該公司在五月份的年度開發者大會上宣佈的一個大型語言模型。宣佈。

觀看：OpenAI靈魂之戰內幕

在過去的一年裏，谷歌一直面臨着重塑其核心搜索業務並應對人工智能程序崛起的壓力。儘管該公司長期以來一直被視為人工智能研究的先驅，但一些人批評其管理層在人工智能產品上市方面行動緩慢，特別是在像ChatGPT和圖像生成器Dall-E這樣的產品取得病毒式成功之後。自從OpenAI在三月份發佈了GPT-4以來，谷歌一直在努力重新確立其在該領域的領導地位，包括將其日益成熟的搜索業務注入新技術。

Gemini是公司對市場壓力的回應。谷歌表示，這款人工智能模型“本質上是多模態的”，這意味着它從一開始就經過預訓練，可以處理用户基於文本和圖像的提示。例如，在一個視頻演示中，谷歌展示了家長如何通過上傳一張數學問題的圖片以及工作紙上解決問題的照片來幫助孩子做作業。

“Gemini不僅可以解決這些問題，”谷歌軟件工程師泰勒·阿普爾鮑姆在演示中説道，“它還可以閲讀答案，理解對錯之處，並解釋需要更多澄清的概念。”該公司還表示，其“搜索生成體驗”——谷歌搜索引擎的實驗版本，將在明年整合Gemini的新功能。

然而，公司代表警告稱，Gemini仍然容易出現“幻覺”，即由生成式人工智能產生的虛假或捏造信息。柯林斯稱這種現象是“一個尚未解決的研究問題”。公司向記者展示的演示是預先錄製的。

柯林斯表示，Gemini“擁有任何谷歌人工智能模型中最全面的安全評估”。為了對Gemini進行安全評估，他説，谷歌將人工智能模型暴露於對抗性測試中，即模仿惡意行為者試圖利用該程序的提示。測試包括“真實毒性提示”，這是由艾倫人工智能研究所開發的測試，其中包含了來自網絡的超過10萬個提示，旨在幫助人工智能研究人員檢查大型語言模型中的仇恨言論和政治偏見。

該公司還強調該工具將會非常快速。Gemini使用了新的基礎超級計算機架構和更新的處理芯片，使其比之前的較小型號運行速度更快，該公司表示。谷歌正在使用新版本的雲芯片，雲張量處理單元（TPU），這些芯片是公司內部設計的，可以比之前的模型訓練快2.8倍。谷歌的機器學習副總裁阿明·瓦達特表示，這種方法為谷歌提供了“對未來標準人工智能基礎設施的新視角”。他補充説，該公司仍然使用第三方人工智能芯片來運行其Gemini模型。

Gemini將集成到Bard中，Bard是谷歌的生成式人工智能聊天機器人，於三月份推出，使其能夠利用公司最受歡迎的服務，包括Gmail、地圖、文檔和YouTube。推出將分兩個不同階段進行：從週三開始，Bard將由Gemini Pro提供動力，這將實現高級推理、規劃、理解和其他功能。它將能夠在170個國家和地區以英語運行，但顯然不包括歐洲或英國，該公司表示正在與當地監管機構合作。

明年初，該公司計劃推出Bard Advanced，它將由性能更強大的Gemini Ultra模型提供動力。谷歌表示，將很快啓動一個可信的測試者計劃，以在向公眾更廣泛推出Bard Advanced之前改進其性能。

谷歌Bard產品副總裁Sissie Hsiao表示，“通過Gemini，Bard將獲得迄今為止最大最好的升級，它將開啓人們創造、互動和協作的新方式。”