谷歌為ChatGPT競爭對手展示的演示受到一些員工的批評 - 彭博社

Shirin Ghaffary, Davey Alba

2023-12-08

桑達爾·皮查伊在五月份於加利福尼亞州山景城舉行的Google I/O開發者大會上。

攝影師：大衞·保羅·莫里斯/彭博社本週，谷歌用一段視頻演示其新的ChatGPT競爭對手，令觀眾大為震驚。然而，在某些情況下，這項技術並不像人們想象的那樣有效。但首先…

三件事值得知道：

• 歐盟代表們在近24小時的辯論後仍然在人工智能規則上存在分歧• 一家AI驅動的駛入式系統的熱門供應商在審核訂單時嚴重依賴人工• 一家航空航天領域的AI初創公司在新融資中估值約3億美元

谷歌的鴨子問題

當谷歌推出其期待已久的ChatGPT競爭對手Gemini時，最令人瞠目結舌的用例可能涉及一隻鴨子。在週三分享的預先錄製視頻演示中，一個無形的手展示了繪製這種動物。AI系統似乎實時分析着繪製的圖像，並以人類聲音與用户進行對話。

谷歌CEO桑達爾·皮查伊推廣了這段視頻，寫道：“瞭解Gemini潛在的驚人能力的最佳方式是親眼目睹，快來看看⬇️。” X上的其他人表示這個演示“令人驚歎”和“不真實”。

Eli Collins，Google DeepMind產品副總裁告訴彭博社，繪製鴨子的演示仍然是研究級能力，目前至少不在Google的實際產品中。週三發佈的Gemini是Google今年全力追趕OpenAI的ChatGPT並重新奪回在人工智能行業中無可爭議的領導地位的結果。但是鴨子演示突顯了Google人工智能技術的承諾與用户目前能夠體驗到的差距。Google表示，Gemini是迄今為止其最大、最有能力和靈活的人工智能模型，取代了今年5月發佈的PaLM 2。該公司表示，Gemini在30項32個基準測試中超過了領先的人工智能模型，測試包括推理、數學、語言和其他指標。據Google稱，Gemini在其中七項基準測試中特別擊敗了OpenAI最近的人工智能模型GPT-4，儘管其中一些邊際很小。Gemini還是多模態的，這意味着它可以理解視頻、圖像和代碼，這使其與只能輸入圖像和文本的GPT-4有所區別。“對我們來説，這是一個新時代，”Collins在活動結束後接受採訪時説。“從研究角度來看，這是V1。這只是個開始。”

Google正在分階段推出Gemini。Gemini Ultra是最有能力的版本，據該公司稱在大多數測試中優於GPT-4，將在明年初發布。其他功能，比如鴨子視頻中演示的功能，仍在開發中。

在內部，一些Google員工一直在討論未在顯著位置披露視頻是否會誤導公眾。在公司範圍內的論壇上，一名Google員工分享了一個暗示鴨子視頻被欺騙性編輯的表情包。另一個表情包展示了荷馬·辛普森的卡通形象，自豪地站在他的內褲上，標題是：“Gemini演示”。它與同一姿勢的荷馬的不那麼令人愉快的背面照片形成對比，他的鬆弛皮膚被擠在一起。標題是：“真實的演示”。

另一位谷歌員工在評論中説，“我猜視頻創作者更看重‘講故事’的方面。”

ChatGPT 對 Gemini：親身體驗

目前，用户可以在谷歌的免費聊天機器人 Bard 中體驗 Gemini 的中級版本。該公司表示，這個版本在八項行業基準測試中有六項超過了 OpenAI 的 GPT 模型（GPT 3.5）的可比版本。

在我們自己對新改版的 Bard 進行的有限測試中，我們發現它大多數情況下與 ChatGPT 3.5 相當或更好，並且在某些方面比舊版的 Bard 更好。然而，在某些任務上它仍然不可靠。

在我們用七道 SAT 數學和推理問題來詢問 Bard 時，它正確回答了四道，錯誤回答了兩道，並且表示不知道一道的答案。它還正確回答了三道閲讀理解問題中的一道。當我們測試 GPT 3.5 時，它得到了類似的結果，但它能夠回答一道讓 Bard 無法回答的問題。

像所有大型語言模型一樣，Bard 仍然會偶爾產生幻覺或提供錯誤信息。例如，當我們問 Bard 它運行在哪個 AI 模型上時，它錯誤地告訴我是 PaLM2，而實際上是它之前使用的版本。

在一些規劃導向的任務上，Bard 的能力似乎明顯優於產品的上一個版本，並且與 ChatGPT 相比也有所改進。例如，當詢問如何規劃一次邁阿密的女生之旅時，Bard 給出了一個有用的按天分隔的早上、下午和晚上行程安排。第一天，它從當地餐廳的“美味古巴早餐”開始，然後是比斯坎灣的船遊和南海灘的夜生活。當我給 ChatGPT 3.5 相同的提示時，答案更長，也不太具體。

為了測試Bard的創造力，我們要求它寫一首關於OpenAI最近董事會混亂的詩。它想出了一些憂鬱的句子，包括：“OpenAI，在混亂的掌控中/看到願景破滅，聯盟分裂。” GPT 3.5的詩沒有很好地捕捉到情緒，因為它只能訪問到2022年初的在線信息。“然而，購買ChatGPT 4的人可以獲得實時信息，它的詩更貼近主題：“Sam Altman，一個名字，被放在頭條/一個受質疑的領導者，一個廣闊的未來。”

在我們的採訪中，DeepMind的Collins説Bard現在是“世界上最好的免費聊天機器人”之一，擁有Gemini升級。根據我們有限的測試，他可能是對的。

**有關AI的問題？**給我發電子郵件，Shirin Ghaffary，我會盡量在未來的新聞簡報中回答你的問題。

本週人物語錄

“當我們真正想要的只是能夠正常運作的東西時，我們被技術束縛住了。”

道格拉斯·亞當斯，作家### 值得關注的人物

先進微設備推出了新的“加速器芯片”，以比其競爭對手更快地運行AI軟件，與芯片巨頭英偉達競爭
Meta和IBM與40家公司合作創建了一個致力於開源AI工作的行業組織
眾議院共和黨人阻止了一項旨在加快芯片開發的法案，這是美國商務部長吉娜·雷蒙多的重要優先事項
埃隆·馬斯克的xAI初創公司正尋求籌集10億美元的股權
阿里巴巴的“Animate Anyone”圖像到視頻模型據説是在刮取了著名TikToker的視頻進行訓練的

彭博社更多內容

獲取科技日報以及更多彭博科技週刊，直接發送到您的收件箱：

網絡安全簡報涵蓋黑客和網絡間諜的陰影世界
遊戲動態報道視頻遊戲行業
動力源提供蘋果獨家新聞、消費者科技動態等
銀幕時光報道好萊塢和硅谷的碰撞
聲音碎片報道播客、音樂行業和音頻趨勢