谷歌和微軟的聊天機器人錯誤地聲稱以色列停火 - 彭博社

Shirin Ghaffary

2023-10-12

攝影師：尼古拉斯·馬特林克/法新社/蓋蒂圖片社谷歌和微軟的AI聊天機器人在以色列-哈馬斯戰爭的一些基本事實上出現了錯誤。但首先…

三件事要知道：

• 美國太空部隊暫時禁止使用基於網絡的生成式AI工具• 微軟即將讓您更容易地讓AI為您撰寫電子郵件，或好或壞• Adobe宣佈其生成式AI模型的新版本，承諾提供更高質量的圖像

戰爭的迷霧

本週以色列和加沙的火箭繼續飛行時，谷歌和微軟的AI聊天機器人錯誤地聲稱實際上已經達成停火協議。

“儘管存在一些緊張局勢和偶發的暴力事件，”谷歌的巴德週一告訴我，“雙方都致力於”保持和平。微軟的AI動力Bing Chat同樣在週二寫道，“停火標誌着即將結束的流血事件。”

在本週的一個實驗中，我向這兩個AI聊天機器人提出了一系列關於戰爭的基本問題。雖然這些聊天機器人通常在一個敏感話題上保持平衡，並經常給出不錯的新聞摘要，但它們有時也會產生明顯的錯誤，這會削弱其整體回答的可信度，並增加對一個複雜而迅速發展的戰爭的公眾困惑。

除了關於目前停火的説法外，巴德還預測了未來某個日期的確切死亡人數。截至2023年10月11日，死亡人數已超過1300人，”巴德於10月9日告訴我。

以色列-哈馬斯衝突是後ChatGPT時代發動的第一場重大戰爭，對新一代AI聊天機器人是一次獨特的考驗。戰爭的迷霧可能會使媒體和軍方成員陷入困境；AI聊天機器人似乎也不例外。但如果這些工具在當前事件上出現明顯錯誤，人們可能會更難找到可靠的新聞來源 - 尤其是在社交媒體充斥着錯誤信息，甚至亞馬遜的Alexa曾重複傳播關於2020年選舉的陰謀論。

谷歌和微軟在它們的生成式AI聊天機器人上發佈明確的免責聲明，警告它們是實驗性的且不準確的。但這些公司也在吹噓這些新的AI產品將成為人們在線搜索信息的未來核心。谷歌已經開始將AI生成的內容放入其搜索結果中，供一些選擇加入的用户使用 - 隨着時間的推移，幾乎可以肯定會擴展到更多谷歌搜索用户。微軟最近也在Bing搜索結果中添加了更多AI生成的內容。

谷歌的一位發言人在一份聲明中表示，公司在其所有產品中都認真對待“信息質量”，並指出了一些工具，包括Bard中的“雙重檢查”功能，幫助用户核實AI生成的結果。（然而，當我們嘗試這個功能來回答停火問題時，它鏈接到了一個過時的新聞報道。）谷歌還表示，所有由大型語言模型驅動的AI系統 - 這些模型通過大量在線數據來生成響應 - “會犯錯，尤其是在涉及突發新聞時。”

“我們繼續快速實施改進，以更好地保護免受低質量或過時響應的影響，例如這些查詢，”該公司表示。微軟表示已經調查了這個問題，並正在進行改變以提高其響應的準確性。“通過向系統提供來自頂級搜索結果的文本和指導，我們在聊天體驗方面取得了重大進展，並將繼續進行進一步的投資，”一位發言人表示。

人工智能聊天機器人眾所周知地在處理虛假信息方面存在困難。布朗大學計算機科學教授、前白宮技術顧問之一Suresh Venkatasubramanian表示，這些系統“只被訓練來預測下一個聽起來合理的答案”。“但特別是對於那些快速變化的話題，即時新聞，以及可能沒有攝入足夠當前數據的衝突話題——它不會準確。”AI權利法案草案的合著者之一。

谷歌和微軟的人工智能聊天機器人現在能夠利用實時新聞報道和在線數據來回應當前事件。用户可以看到引用——在必應聊天中默認顯示，在谷歌的Bard中如果您要求它雙重檢查工作——這是有幫助的。然而，這並不足以防止不準確的信息，尤其是對於可能有各種相互矛盾的新聞報道的事件。例如，當我在必應和Bard上點擊有關停火的引用時，它鏈接到了2023年5月該地區先前的停火報告，這確實發生過，但顯然已經過時。

美國國務卿安東尼·布林肯和國務院巴勒斯坦事務辦公室在X上發佈了呼籲停火的帖子（以前是Twitter），但很快刪除了他們的聲明在以色列支持者的反對聲中，他們表示現在要呼籲停火還為時過早。拜登後來全力支持以色列自衞。這種細微差別也可能被AI聊天機器人忽略了。

當我在後續問題中再次問巴德是否確定有停火時，它糾正了錯誤。“不，我不確定那是對的。我為之前的回答道歉，”聊天機器人説。微軟的必應聊天在週三早上改變了它的回答，説沒有停火。

有一次，我問巴德評價自己的能力。它是關於戰爭的信息的有用來源嗎？

“我有時會在對新聞的理解上犯錯誤。如果你正在尋找關於以色列哈馬斯衝突最準確和最新的信息，我建議你查閲多個來源，”聊天機器人告訴我。

那個由AI生成的聲明，我可以百分之百確定，是正確的。

**有關AI的問題？**給我發電子郵件，Shirin Ghaffary，我會盡力在未來的新聞簡報中回答您的問題。

本週人類語錄

“也許我們都應該停下來，不僅關注如何讓我們的人工智能變得更好更成功，還要關注對人類的利益。”

-- 史蒂芬·霍金

值得關注

Bloomberg### 深度學習

谷歌產品經理、設計師和工程師正在使用Discord公開討論其AI聊天機器人Bard的效果和實用性，一些人質疑投入開發的巨大資源是否值得
來自Rest of World的一項分析發現，生成式AI系統延續了與國家身份相關的偏見和刻板印象
一項經過同行評議的分析發現，到2027年，AI服務器可能會消耗與整個國家相當的電力
AMD已同意收購一家AI軟件初創公司，以趕上英偉達
中國計劃在不到三年的時間內將該國的計算能力增長超過三分之一

戰爭的迷霧

值得關注

更多來自彭博社