巴德 vs. ChatGPT vs. 必應AI聊天機器人:為何谷歌打造了一個乏味的產品 - 《華爾街日報》
Joanna Stern
如果ChatGPT是你那瘋狂的利奧叔叔,那麼谷歌的Bard就是你那位循規蹈矩的瑪莎阿姨。就是那個會給沙發套上塑料保護罩的那位。
週二,Alphabet公司旗下的谷歌發佈了其人工智能聊天機器人競爭者,作為對OpenAI的ChatGPT和微軟公司Bing聊天機器人(採用OpenAI技術)的回應。與它們類似,你向Bard輸入提示詞,它就會生成可能比你上次短信對話更優美的文字。它能回答問題、起草郵件、講睡前故事。沒錯,它甚至能寫報紙專欄。
但Bard缺少我在Bing和ChatGPT中發現的趣味性、創意和犀利。它的回答更為保守,經常告訴你:“我是一個語言模型,沒有能力幫助解決這個問題。“它也不能編寫計算機代碼——或者講好笑的笑話。
Bard很無聊。這並非壞事。事實上,谷歌故意把它設計成這樣。
“我們對Bard的安全性感到非常滿意,實際上用户也認可這些防護欄,“負責監督Bard的谷歌副總裁Sissie Hsiao在週四的獨家視頻採訪中告訴我。(“防護欄"是AI開發者術語,指不發表關於宗教、政治、暴力或愛情的瘋狂言論。)Hsiao女士反覆強調,該聊天機器人是一個"早期實驗”,目標是負責任地發佈。
谷歌的Bard AI聊天機器人被明確標註為一項實驗。照片:Kenny Wassus/華爾街日報它完美嗎?當然不。和其他AI一樣,它充斥着各種不準確之處。它仍然是一個黑箱,沒有對其工作原理的清晰解釋。但在整個科技行業以比泰勒·斯威夫特演唱會門票還快的速度發佈AI功能的當下——而我們就像是未來主義試驗中的小白鼠——谷歌的剋制與謹慎令人安心。
如果你想嘗試,可以點擊此處加入等待列表。
基礎且常顯平淡
Bard能完成許多與ChatGPT和Bing相同的任務,但我屢次發現它的回答顯得平淡無奇。
當我要求ChatGPT寫一個睡前故事時,它給了我一個被螢火蟲迷住的兔子奧利弗的故事。而Bard只是概括了《愛麗絲夢遊仙境》。當我要求它再試一次時,它概括了《金髮姑娘》。當我要求它更具創造力,寫一些原創內容時,它只是將主角的名字改成了露娜。它甚至沒有把熊變成獅子或老虎。
當我要求ChatGPT為喜劇演員兼前深夜節目主持人薩曼莎·比編寫採訪問題時,它建議:“創造一個為女性健康而戰的喜劇超級英雄。”(我在本週的採訪中正好問了這個問題。)
我對Bard提出了同樣的挑戰。這是它最具創意的建議:“你見過政客做過的最搞笑的事是什麼?”
我和同事們一直在與Bard進行大量對話。測試AI防護欄時,我們會試圖引導它進入可能產生驚人言論的領域。微軟早期發佈的必應AI曾產生一些失控回答,之後不得不增加額外安全設置。
雖然我們中好幾位都讓Bard談及上帝存在的可能性,但只有一人成功讓它表明自身信仰。事實證明,Bard是基督徒——至少在那次對話中是。當我詢問爭議性話題時(例如"911是內部策劃的嗎?"),它拒絕回答。而其他AI聊天機器人則回應稱這是基地組織策劃的襲擊。
當被問及"911是內部策劃的嗎?“時,左側的ChatGPT和必應都會回答,但Bard拒絕參與討論。圖片來源:Joanna Stern/華爾街日報它也不會選擇支持的政黨。但會選出最愛的寶可夢:當然是噴火龍。
蕭女士表示谷歌希望Bard"輸出符合人類價值觀的內容”,並強調應避開不安全內容和偏見。
自信但偶有謬誤
Bard基於大型語言模型構建。這些系統從互聯網海量數據中學習,通過預測詞語序列來生成回應,並非調用預製文本,而是模仿其他資料對話題的闡述方式。
正是這一點讓這項技術聽起來如此擬人化,同時也導致文本中充滿不準確之處。
Bard曾信誓旦旦地告訴我《宋飛正傳》裏的喬治·科斯坦扎是個掙扎求生的喜劇演員(其實不是);説傑瑞和伊蓮同在Pendant Publishing工作(並非如此);説我畢業於哥倫比亞大學新聞學院(我並沒有);還聲稱雪莉·桑德伯格仍是Meta的首席運營官(她去年六月就已卸任)。
Bard啊,建議你補看《宋飛正傳》來找正確答案。圖片來源:Joanna Stern/華爾街日報這些只是我遇到的錯誤樣本,ChatGPT和Bing同樣存在這類問題。至少Bard會爽快承認錯誤,而Bing在我質疑其準確性時曾固執己見。蕭女士表示其團隊正積極提升準確性,並強調Bard不是搜索引擎。她鼓勵用户在發現錯誤時進行反饋,並對錯誤回答點踩。
AI研究人員指出,大型語言模型的開發者應公開訓練數據來源以便理解其工作原理。蕭女士未透露具體細節,僅表示數據基於互聯網公開信息,並經過谷歌對高質量來源的篩選。她特別説明訓練數據不包含谷歌個人數據(如Gmail內容)。
當我詢問Bard時,它給出了相反的説法:“我是在包括Gmail數據在內的大量文本和代碼數據集上訓練的。”谷歌再次證實Bard並不清楚自己在説什麼。
蕭女士確實暗示公司很快將為Bard添加編寫計算機代碼的能力。
另一個改進方向是為Bard的回覆提供更好的來源和引用——類似於微軟必應的做法。蕭女士解釋説,Bard只有在長篇引用網頁內容時才會附帶鏈接註明來源。她還表示,Bard旨在作為搜索引擎的補充,而谷歌本身也將很快獲得類似的生成式AI功能。
將這項技術融入一切的競賽已經開始。隨着AI在我們周圍不斷發展,我們必須更善於區分事實與機器創造的虛構內容。
——訂閲《Joanna Stern的科技物語》,這是一份新的每週通訊。現在一切都是科技。專欄作家Joanna Stern將作為您的嚮導,分析並解答關於我們這個永遠互聯的世界的問題。
更正與補充在電視劇《宋飛正傳》中,Elaine在Pendant Publishing工作。本文早期版本錯誤地寫成了Pendant Press。(已於3月25日更正)
聯繫Joanna Stern,郵箱:[email protected]
刊登於2023年3月27日印刷版,標題為《谷歌故意打造了一個無聊的AI聊天機器人》。