AI幻覺困擾聊天機器人可能具有實用性 - 彭博社
Austin Carr
插圖:彭博商業週刊的帕特里克·凱爾設計師Colin Dunn喜歡當像Midjourney和OpenAI的Dall-E這樣的人工智能圖像生成服務似乎出錯併產生一些隨機的東西,比如當它們對一個關於一羣人一起走路的圖像的請求做出回應時,卻呈現出一個單獨的人物向遠處走去。這讓Dunn想起了和同事一起嘗試一堆奇怪想法,然後偶然發現正確的那個。
Dunn的創業公司,Visual Electric Co.,開發了一種新穎的網絡界面來利用這一過程。文本到圖像生成器通常會在聊天窗口中輸出一次性圖像,但在Dunn的應用中,輸出被保存在行中,並排在它們修改的圖像旁邊或下方,形成了縮略圖畫廊。結果是一堆草稿,讓用户根據人工智能如何解釋他們的連續請求來探索各種創意想法,無論是好是壞。
Visual Electric的人工智能圖像編輯器。來源:Visual Electric這個工作流程旨在激發“雜亂、混亂的探索”,Dunn説,他曾是Dropbox和Facebook的設計師,他位於加利福尼亞索薩利托的創業公司得到了Sequoia Capital的支持。他的公司不太關注以儘可能少的點擊次數達到預期結果,而是讓人工智能以出人意料的方式自由奔放。有工具可以自動重寫更不尋常的描述,用心情改變美學,調整計算機解釋你的話的自由度。
換句話説,Visual Electric的目標之一是鼓勵“幻覺”,這是AI系統在其訓練數據中糾纏並編造東西的偽科學術語。工程師們在ChatGPT於2022年底公開發布之前就一直在努力阻止聊天機器人產生幻覺,但聊天機器人和其他類似的系統仍然傾向於在回答用户查詢時混入虛假的“事實”。例如,當被問及通貨膨脹時,Google的Bard發明了一系列聽起來真實的經濟書籍,包括虛假摘要。在整合OpenAI技術後,必應參與了一些臭名昭著的交流,威脅要勒索並向早期評論者表白愛意。這種逼真而不可預測的回覆不僅給人留下了機器人有自己思想的印象,而且給人以它們已經失去思想的印象。
如果人們要依賴像驅動ChatGPT的大型語言模型進行在線搜索、寫作或其他應用,這種幻覺可能成為一個無法接受的問題。隨着公眾在2023年對人工智能感到恐慌,技術與事實的糾纏關係激發了無數關於混淆的宣言,聲稱混淆的計算機可能威脅到真理本身的概念。
AI系統產生幻覺的傾向已成為績效的基準。Galileo是一家幫助企業客户優化生成式AI應用程序的公司,推出了一個幻覺指數,該指數對來自Hugging Face、Meta Platforms和OpenAI等公司的AI系統的正確性進行排名。Galileo首席執行官Vikram Chatterji表示,金融到醫療保健等各行各業的公司特別渴望對面向消費者的AI產品擁有“極端控制”。他解釋説:“他們最擔心的問題是:‘如果我發佈這個東西,它會胡説八道怎麼辦?這可能會損害我們的品牌、股票,對世界來説也是非常糟糕的事情。”
由於現代AI的複雜性,專家們不確定這個問題是否能夠完全解決。不過,也許並非所有問題都需要解決。“有時幻覺實際上是特性;這就是創造力,有時它是一個bug,”微軟首席執行官薩提亞·納德拉最近在被問及這個問題的後果時説道。“我們都在努力改進如何變得更好。”
在未來一年,越來越多的開發者將致力於利用這些錯誤和幻想中的魔力。鄧恩將其比作一些人類尋求利用化學物質激發藝術衝動的也許有風險的方式。“LSD之旅是一個非常貼切的比喻,”他開玩笑説。“如果模型只做了你要求它做的事情,那它就不是一個真正的創造夥伴。”
Anastasis Germanidis,文本轉視頻獨角獸Runway AI Inc.的首席技術官表示,一定程度的“紮根性”是必要的——對貓的請求片段需要展示貓,而不是狗——但他的團隊不想扼殺幻想的產出。對於較短的提示,Germanidis表示,Runway有時會填補空白,“給模型更多自由地想象缺失的屬性或用户沒有明確提供的屬性。”
他還發現創意專業人士正在玩弄這個程序,提供複雜的提示來引發超現實的視覺。導演保羅·特里洛(Paul Trillo)就在Runway中製作了一部備受讚譽的短片,傾向於引擎更迷幻的效果,其中包括地鐵下沉和麪部特徵像粘土動畫一樣移動的場景。缺陷正是使它如此迷人。在接受《紐約客》採訪時,特里洛描述了這部名為《謝謝你不回答》的電影,稱之為“部分愛德華·霍普和部分大衞·林奇”,他説AI做出了他不會做出的電影選擇,並且“感覺就像在夢中飛翔一樣。”
其他開發人員正試圖通過微量給AI系統限制。Inworld AI幫助視頻遊戲開發人員構建互動電腦角色,他們開發了一個“第四面牆”功能,限制角色對人類玩家的反應方式。這些AI角色被注入個性特徵、情感、記憶和抱負,這可能導致有趣和獨特的行為。但聯合創始人兼產品負責人Kylan Gibbs表示,如果它們偏離劇本太遠,就會破壞沉浸感。在《星球大戰》遊戲中的機器人應該能夠虛構關於其家鄉星球的個人背景,但不應錯誤地否認達斯·維達是盧克·天行者的父親。“擴展世界的幻覺和破壞世界的幻覺之間存在一種平衡,”Gibbs説。
儘管如此,他指出一些開發者正在關閉第四面牆功能,特別是在較小的《龍與地下城》類遊戲中,那裏的宇宙並不受幾十年敍事規範的限制。他還看到遊戲製作者在製作過程中取消了這個設置,並使用幻覺來構想新的故事情節和支線任務。“你會看到一位作家説,‘我對這個世界有個大致的想法。我只是要在其中創造角色,開始和他們交談,看看會發生什麼,’” Gibbs説。
從這個意義上説,並不是對幻覺的容忍度在改變,而是它的定義在改變。創意型人才更多地在人格化的意義上談論它,而不是作為一種製造虛假的機器。在處理機器生成的歌曲或營銷活動時出現的小問題可能正是用户所期望的。
Visual Electric的鄧恩在生成人工智能圖形時經常遇到這種情況。隨着指令越來越長,計算機最終偏離了他的意圖。“你的第一反應是‘這太糟糕了,這不是我想要的,’” 鄧恩説。但是,幾分鐘後盯着它看,他經常意識到:計算機是對的。*閲讀下一篇:*谷歌無法捕捉所有的AI圖像。你能嗎?