谷歌為ChatGPT競爭對手展示的演示受到一些員工的批評 - 彭博社
Shirin Ghaffary, Davey Alba
桑達爾·皮查伊在五月份於加利福尼亞州山景城舉行的Google I/O開發者大會上。
攝影師:大衞·保羅·莫里斯/彭博社本週,谷歌用一段視頻演示其新的ChatGPT競爭對手,令觀眾大為震驚。然而,在某些情況下,這項技術並不像人們想象的那樣有效。但首先…
三件事值得知道:
• 歐盟代表們在近24小時的辯論後仍然在人工智能規則上存在分歧• 一家AI驅動的駛入式系統的熱門供應商在審核訂單時嚴重依賴人工• 一家航空航天領域的AI初創公司在新融資中估值約3億美元
谷歌的鴨子問題
當谷歌推出其期待已久的ChatGPT競爭對手Gemini時,最令人瞠目結舌的用例可能涉及一隻鴨子。在週三分享的預先錄製視頻演示中,一個無形的手展示了繪製這種動物。AI系統似乎實時分析着繪製的圖像,並以人類聲音與用户進行對話。
谷歌CEO桑達爾·皮查伊推廣了這段視頻,寫道:“瞭解Gemini潛在的驚人能力的最佳方式是親眼目睹,快來看看⬇️。” X上的其他人表示這個演示“令人驚歎”和“不真實”。
Eli Collins,Google DeepMind產品副總裁告訴彭博社,繪製鴨子的演示仍然是研究級能力,目前至少不在Google的實際產品中。週三發佈的Gemini是Google今年全力追趕OpenAI的ChatGPT並重新奪回在人工智能行業中無可爭議的領導地位的結果。但是鴨子演示突顯了Google人工智能技術的承諾與用户目前能夠體驗到的差距。Google表示,Gemini是迄今為止其最大、最有能力和靈活的人工智能模型,取代了今年5月發佈的PaLM 2。該公司表示,Gemini在30項32個基準測試中超過了領先的人工智能模型,測試包括推理、數學、語言和其他指標。據Google稱,Gemini在其中七項基準測試中特別擊敗了OpenAI最近的人工智能模型GPT-4,儘管其中一些邊際很小。Gemini還是多模態的,這意味着它可以理解視頻、圖像和代碼,這使其與只能輸入圖像和文本的GPT-4有所區別。“對我們來説,這是一個新時代,”Collins在活動結束後接受採訪時説。“從研究角度來看,這是V1。這只是個開始。”
Google正在分階段推出Gemini。Gemini Ultra是最有能力的版本,據該公司稱在大多數測試中優於GPT-4,將在明年初發布。其他功能,比如鴨子視頻中演示的功能,仍在開發中。
在內部,一些Google員工一直在討論未在顯著位置披露視頻是否會誤導公眾。在公司範圍內的論壇上,一名Google員工分享了一個暗示鴨子視頻被欺騙性編輯的表情包。另一個表情包展示了荷馬·辛普森的卡通形象,自豪地站在他的內褲上,標題是:“Gemini演示”。它與同一姿勢的荷馬的不那麼令人愉快的背面照片形成對比,他的鬆弛皮膚被擠在一起。標題是:“真實的演示”。
另一位谷歌員工在評論中説,“我猜視頻創作者更看重‘講故事’的方面。”
ChatGPT 對 Gemini:親身體驗
目前,用户可以在谷歌的免費聊天機器人 Bard 中體驗 Gemini 的中級版本。該公司表示,這個版本在八項行業基準測試中有六項超過了 OpenAI 的 GPT 模型(GPT 3.5)的可比版本。
在我們自己對新改版的 Bard 進行的有限測試中,我們發現它大多數情況下與 ChatGPT 3.5 相當或更好,並且在某些方面比舊版的 Bard 更好。然而,在某些任務上它仍然不可靠。
在我們用七道 SAT 數學和推理問題來詢問 Bard 時,它正確回答了四道,錯誤回答了兩道,並且表示不知道一道的答案。它還正確回答了三道閲讀理解問題中的一道。當我們測試 GPT 3.5 時,它得到了類似的結果,但它能夠回答一道讓 Bard 無法回答的問題。
像所有大型語言模型一樣,Bard 仍然會偶爾產生幻覺或提供錯誤信息。例如,當我們問 Bard 它運行在哪個 AI 模型上時,它錯誤地告訴我是 PaLM2,而實際上是它之前使用的版本。
在一些規劃導向的任務上,Bard 的能力似乎明顯優於產品的上一個版本,並且與 ChatGPT 相比也有所改進。例如,當詢問如何規劃一次邁阿密的女生之旅時,Bard 給出了一個有用的按天分隔的早上、下午和晚上行程安排。第一天,它從當地餐廳的“美味古巴早餐”開始,然後是比斯坎灣的船遊和南海灘的夜生活。當我給 ChatGPT 3.5 相同的提示時,答案更長,也不太具體。
為了測試Bard的創造力,我們要求它寫一首關於OpenAI最近董事會混亂的詩。它想出了一些憂鬱的句子,包括:“OpenAI,在混亂的掌控中/看到願景破滅,聯盟分裂。” GPT 3.5的詩沒有很好地捕捉到情緒,因為它只能訪問到2022年初的在線信息。“然而,購買ChatGPT 4的人可以獲得實時信息,它的詩更貼近主題:“Sam Altman,一個名字,被放在頭條/一個受質疑的領導者,一個廣闊的未來。”
在我們的採訪中,DeepMind的Collins説Bard現在是“世界上最好的免費聊天機器人”之一,擁有Gemini升級。根據我們有限的測試,他可能是對的。
**有關AI的問題?**給我發電子郵件,Shirin Ghaffary,我會盡量在未來的新聞簡報中回答你的問題。
本週人物語錄
“當我們真正想要的只是能夠正常運作的東西時,我們被技術束縛住了。”
道格拉斯·亞當斯,作家### 值得關注的人物
在最新一期的AI IRL中,彭博社探討了音樂家、出版商和版權所有者對生成式人工智能快速發展的一些最具爭議的擔憂。彭博社### 深度學習
- 先進微設備推出了新的“加速器芯片”,以比其競爭對手更快地運行AI軟件,與芯片巨頭英偉達競爭
- Meta和IBM與40家公司合作創建了一個致力於開源AI工作的行業組織
- 眾議院共和黨人阻止了一項旨在加快芯片開發的法案,這是美國商務部長吉娜·雷蒙多的重要優先事項
- 埃隆·馬斯克的xAI初創公司正尋求籌集10億美元的股權
- 阿里巴巴的“Animate Anyone”圖像到視頻模型據説是在刮取了著名TikToker的視頻進行訓練的
彭博社更多內容
獲取科技日報以及更多彭博科技週刊,直接發送到您的收件箱:
- 網絡安全簡報涵蓋黑客和網絡間諜的陰影世界
- 遊戲動態報道視頻遊戲行業
- 動力源提供蘋果獨家新聞、消費者科技動態等
- 銀幕時光報道好萊塢和硅谷的碰撞
- 聲音碎片報道播客、音樂行業和音頻趨勢