AI新聞可靠性報告亮紅燈，45%回答存重大錯誤，Gemini成重災區

2025-10-24

【環球網科技綜合報道】近日，一項跨越18國、涵蓋14種語言的大規模研究向風頭正勁的AI助手潑下冷水。10月24日消息，據外媒Gizmodo報道，歐洲廣播聯盟最新研究報告指出，主流AI聊天機器人在處理新聞內容時存在系統性缺陷，近半數回答存在重大問題，嚴重威脅公眾信息獲取質量。

這項聯合22家公共服務媒體的研究對ChatGPT、Copilot、Gemini和Perplexity等主流AI平台進行了3000次測試。結果顯示，45%的回答存在至少一個重大錯誤，81%的回答包含輕微問題。信息來源缺失和準確性不足成為兩大重災區，分別影響31%和30%的回答。

研究負責人德滕德警告：“這些錯誤具有系統性、跨國界和多語言特性，當人們不知該信什麼時，最終會選擇什麼都不信。”

Gizmodo報道稱，在平台表現方面，Google Gemini以76%的錯誤率墊底，是其他產品的兩倍多。儘管與半年前相比部分模型有所改進，但錯誤率依然高企。研究人員特別指出，AI在處理突發新聞、複雜時間線和需要區分觀點的事實類問題時尤為薄弱。

然而與AI可靠性形成鮮明對比的是其迅猛普及。路透研究所數據顯示，使用AI獲取新聞的用户數量一年內翻倍，在阿根廷、美國及18-24歲年輕人中滲透率最高。更值得警惕的是，48%的年輕用户依賴AI簡化新聞理解。（旺旺）