研究人員有一個理解人工智能的神奇工具:哈利·波特 - 彭博社
Saritha Rai
一個行人走過倫敦西區的《哈利·波特與被詛咒的孩子》演出劇院,2020年。
攝影師:西蒙·道森/Bloomberg在J.K.羅琳介紹了一個充滿魔法生物、禁忌森林和一個少年巫師的宇宙兩個多十年之後,哈利·波特在一個截然不同的文學體裁中找到了新的相關性:人工智能研究。越來越多的研究人員正在使用暢銷書《哈利·波特》來進行生成式人工智能技術的實驗,引用該系列作品在流行文化中的持久影響以及其頁面中豐富的語言數據和複雜的文字遊戲。回顧引用哈利·波特的研究和學術論文的列表可以窺見尖端的人工智能研究,以及該技術面臨的一些棘手問題。
也許最引人注目的最近例子是,哈利、赫敏和羅恩在一篇名為“哈利·波特是誰?”的論文中扮演主角,該論文揭示了一種幫助大型語言模型有選擇性地遺忘信息的新技術。這對該行業來説是一項高風險的任務:驅動AI聊天機器人的大型語言模型是建立在大量在線數據的基礎上的,包括受版權保護的材料和其他問題內容。這導致了一些AI公司面臨訴訟和公眾審查。該論文的作者,微軟研究人員馬克·魯辛諾維奇和羅南·埃爾丹表示,他們已經證明了AI模型可以被修改或編輯以刪除對《哈利·波特》書籍的存在的任何知識,包括角色和情節,而不會犧牲AI系統的整體決策和分析能力。這對選擇這些書籍是因為它們的普遍熟悉度。“我們相信,研究界的人們會更容易評估我們的技術產生的模型,並自行確認內容確實已經被‘遺忘’,”微軟Azure首席技術官魯辛諾維奇説。“幾乎任何人都可以提出提示,來探究模型是否‘知道’這些書。甚至那些沒有讀過這些書的人也會知道情節元素和角色。”
在另一項研究中,華盛頓大學西雅圖分校、加州大學伯克利分校和艾倫人工智能研究所的研究人員開發了一種名為Silo的新語言模型,可以刪除數據以減少法律風險。然而,他們在今年早些時候發表的一篇論文中指出,如果僅在低風險文本上進行訓練,比如過期的圖書或政府文件,該模型的性能會顯著下降。
為了更深入地研究,研究人員使用哈利·波特的書來觀察單個文本片段對人工智能系統性能的影響。他們創建了兩個數據存儲,或者説網站和文件的集合。第一個包括除了第一本哈利·波特書之外的所有已出版書籍;另一個包括該系列中的所有書籍,但不包括第二本,以此類推。“當哈利·波特的書從數據存儲中移除時,困惑度變得更糟了,”研究人員説道,指的是衡量人工智能模型準確性的指標。
至少十年來,人工智能研究一直引用哈利·波特,但隨着學者和技術人員專注於能夠處理自然語言並提供相關答案的人工智能工具,這種引用變得更加普遍。關於哈利·波特,“豐富的場景、對話、情感瞬間使其與自然語言處理的特定領域非常相關,”卡內基梅隆大學的研究人員Leila Wehbe説道,她在2014年進行了一系列實驗,收集了人們閲讀哈利·波特故事時的腦部MRI數據,以更好地理解語言機制。在arXiv上,一個開放獲取的科學研究存儲庫,最近的論文包括“霍格沃茨的魔藥開發機器學習”,“大型語言模型遇見哈利·波特”和“使用基於Transformer的人工智能檢測奇幻文學中的咒語”。
即使它並不是研究的核心內容,哈利·波特也是研究人員喜愛的文學參考之一。例如,一項研究使用羅琳的作品來測試人工智能系統的智能,比如生成了聊天機器人ChatGPT的系統,這個話題在最近的辯論中引起了很多熱議。 Terrence Sejnowski,他是索爾克生物學研究所的計算神經生物學實驗室主任,在論文中提出,聊天機器人只是反映了其用户的智能和偏見,就像哈利·波特第一本書中的慾望鏡一樣,它會將一個人的願望反射回給他們。“哈利·波特在年輕的研究人員中很受歡迎,”Wehbe説。“他們在孩童或青少年時期可能已經閲讀過這些書,因此在選擇書面或口頭文本語料庫時會想到它們。”