用AI生成的報告錯誤百出,德勤向澳大利亞政府部分退款
程煦
【文/觀察者網 陳思佳】澳大利亞政府去年與知名會計事務所德勤(Deloitte)簽訂一份價值44萬澳元(約合人民幣206.4萬元)的合同,委託該公司編寫一份獨立評估報告。然而,專家發現,德勤今年早些時候發佈的報告錯誤百出,還引用了一些根本不存在的參考文獻,很可能是生成式人工智能的“幻覺”問題導致的。
據澳大利亞《金融評論報》10月5日報道,報告內容遭到質疑後,德勤承認在編寫報告時使用了生成式AI工具,同意向澳大利亞政府退還部分費用。德勤已修改報告中出現的紕漏,但沒有説明錯誤與AI有關,並堅稱“報告中的實質性內容、結果和建議不受影響”。
德勤在今年7月發佈了第一版報告,內容涉及對澳大利亞福利系統中自動實施處罰的信息技術系統的評估。但不到一個月後,悉尼大學學者克里斯托弗·拉奇注意到,報告中存在多個錯誤,包括引用了不存在的學術參考文獻和虛構的法院判決。
拉奇推測,這些錯誤可能是生成式AI的“幻覺”導致的。德勤最初拒絕對這一問題發表評論,但在當地時間10月3日,該公司悄悄更新了發佈在澳大利亞就業和勞資關係部(DEWR)網站上的報告,刪除了虛構的參考文獻列表,並更正了多處筆誤。

德勤在澳大利亞墨爾本的辦公室 視覺中國
德勤沒有説明錯誤與AI有關,但在報告附錄中承認使用了“DEWR許可的生成式AI大語言模型(Azure OpenAI GPT-4o)工具鏈”。德勤堅稱,報告的更新“不會影響報告中的實質性內容、調查結果和建議”,“此事已直接與客户解決”。
DEWR發言人表示,德勤已同意向澳大利亞政府退還合同的最後一期費用,但拒絕透露具體金額。這名發言人也拒絕回答該部門是否認為報告的錯誤與德勤員工使用AI有關,僅表示“獨立審查的實質性內容將被保留,建議沒有發生變化”。
《金融評論報》指出,這起事件將德勤置於尷尬境地,因為該公司正在向客户和企業高管提供有關AI的諮詢和培訓服務。目前德勤每年全球收入達705億美元,有關AI的諮詢在其中的佔比越來越高。德勤還多次強調,所有AI生成的內容都必須經過人工審查。
儘管德勤和澳大利亞政府堅稱報告的“實質性內容”不受影響,但最先發現問題的拉奇表示,德勤一開始沒有説明使用了AI完成核心分析任務,這降低了報告的可信度。
拉奇認為:“當報告的基礎建立在有缺陷的、最初未公開的且非專業的方法之上時,你就不能再相信這些建議。”
英國《金融時報》稱,包括德勤在內,全球知名的四大會計事務所已為AI研發投入鉅額資金,他們希望利用這項技術來加快向客户提供建議和審計的速度。但德勤這起尷尬的事件,反映出諮詢公司在使用AI技術時存在的風險,特別是AI“幻覺”問題的風險。
英國會計監管機構6月曾警告説,四大會計事務所日益依賴AI和自動化工具來進行風險評估,但這些公司並未有效追蹤此類技術對審計質量的影響。
澳大利亞《金融評論報》認為,AI技術的好壞取決於其使用者,如果德勤能夠指派員工對報告的內容和參考文獻的準確性進行充分的審查,本可以避免這起尷尬的事件。該報評論稱:“AI在現代職場中無處不在,但它還無法完美替代人的智慧和判斷。”
本文系觀察者網獨家稿件,未經授權,不得轉載。