《華爾街日報》:《幻覺":當聊天機器人(和人類)看到不存在的東西》
Ben Zimmer
插圖:James Yang語言學家兼詞典編纂者Ben Zimmer解析新聞詞彙的起源。閲讀往期專欄請點擊此處。
如果你試用過最新的人工智能聊天機器人,如OpenAI的ChatGPT或谷歌的Bard,可能會發現它們能自信且權威地生成完全錯誤的陳述。
例如,我向Bard詢問了“論證性雙元音化”——這個短語其實是我剛編造的。它不僅生成了五段文字來闡述這個虛假現象,還告訴我該術語“由語言學家Hans Jakobsen於1922年首次提出”。不用説,歷史上從未有過名為Hans Jakobsen的著名語言學家(儘管1920年奧運會確實有位同名丹麥體操選手參賽)。
當聊天機器人生成的文本偏離正軌、脱離現即時,AI研究者稱這種現象為“幻覺”。在上週末接受CBS《60分鐘》節目採訪時,谷歌CEO Sundar Pichai承認了開發Bard等語言模型時AI幻覺的風險。“目前該領域尚未有人能解決幻覺問題,”Pichai表示,“所有模型都存在這個缺陷。”
但是,一個用於描述人類幻覺感知的詞彙是如何被應用到計算機合成回應上的呢?這種“幻覺”的説法是否適得其反,助長了這些回應來自一個有意識(即使混亂)心智的觀念?
“幻覺”及其動詞形式“產生幻覺”源自拉丁語“alucinari”,可以意為“在心靈中漫遊”、“做夢”或“被欺騙”。在英語中,從17世紀中葉開始,“幻覺”可以指在沒有實際物體的情況下對物體的明顯感知。
這個術語出現在托馬斯·布朗於1646年出版的一本廣為流傳的科學著作《流行謬誤》中。(布朗的著作幫助普及了科學,並早期出現了“醫學”、“病理學”和“計算機”等詞彙。)布朗寫道,當一個人的視覺“墮落”並“錯誤地接收其對象”時,就會產生幻覺。
心理學家隨後將幻覺分類為影響其他感官的現象。幻覺被歸因於睡眠剝奪、精神障礙和藥物使用等原因。在20世紀50年代,當研究人員研究LSD等迷幻藥物的效果時,他們稱這些藥物為“致幻劑”,即幻覺的產生者。
在人工智能領域,隨着語言模型變得更加複雜,計算機科學家抓住了“幻覺”作為隱喻。在2015年的一篇博客文章中,OpenAI的創始成員安德烈·卡帕西寫道,模型如何可以‘產生’文本回應,比如編造看似合理的URL和數學證明。這個術語在2018年由與谷歌合作的AI研究人員在一篇會議論文《神經機器翻譯中的幻覺》中被採用,該論文分析了自動翻譯如何產生與輸入完全脱節的結果。
我與論文的主要作者、康奈爾大學研究科學家凱瑟琳·李進行了交談,她承認雖然“幻覺”是“無根據”文本生成的便捷簡稱,但它在人工智能討論中的廣泛使用一直存在問題。“這個詞本身受到了不同的批評,”她説,主要是“通過説它們產生幻覺,我們是在擬人化這些模型。”李女士表示,她現在認為“幻覺”是“不是最好的詞”,並很高興有人能想出更好的替代詞。
華盛頓大學計算語言學家艾米麗·M·本德對此表示同意,並指出這個術語錯誤地“暗示語言模型具有感知和經驗。”她還擔心“輕視可能是一種嚴重的心理健康症狀。”雖然像“合成的無根據文本”這樣的替代詞可能有些拗口,但它們避免了想象人工智能系統具有人類感知(無論是幻覺還是其他)的陷阱。
刊登於2023年4月22日的印刷版,標題為《當聊天機器人(和人)看到不存在的東西時》。