AI新聞可靠性報告亮紅燈,45%回答存重大錯誤,Gemini成重災區
【環球網科技綜合報道】近日,一項跨越18國、涵蓋14種語言的大規模研究向風頭正勁的AI助手潑下冷水。10月24日消息,據外媒Gizmodo報道,歐洲廣播聯盟最新研究報告指出,主流AI聊天機器人在處理新聞內容時存在系統性缺陷,近半數回答存在重大問題,嚴重威脅公眾信息獲取質量。

這項聯合22家公共服務媒體的研究對ChatGPT、Copilot、Gemini和Perplexity等主流AI平台進行了3000次測試。結果顯示,45%的回答存在至少一個重大錯誤,81%的回答包含輕微問題。信息來源缺失和準確性不足成為兩大重災區,分別影響31%和30%的回答。
研究負責人德滕德警告:“這些錯誤具有系統性、跨國界和多語言特性,當人們不知該信什麼時,最終會選擇什麼都不信。”
Gizmodo報道稱,在平台表現方面,Google Gemini以76%的錯誤率墊底,是其他產品的兩倍多。儘管與半年前相比部分模型有所改進,但錯誤率依然高企。研究人員特別指出,AI在處理突發新聞、複雜時間線和需要區分觀點的事實類問題時尤為薄弱。
然而與AI可靠性形成鮮明對比的是其迅猛普及。路透研究所數據顯示,使用AI獲取新聞的用户數量一年內翻倍,在阿根廷、美國及18-24歲年輕人中滲透率最高。更值得警惕的是,48%的年輕用户依賴AI簡化新聞理解。(旺旺)