人工智能會夢見電子羊嗎?——《華爾街日報》
Andy Kessler
圖片來源:蓋蒂圖片社昨晚我做了一個奇怪的夢。相信你也常這麼説。但為什麼會做夢?從西格蒙德·弗洛伊德到卡爾·榮格,再到卡爾文·霍爾,人們對夢境的研究已汗牛充棟,卻仍無法確切解釋夢的成因。是無意識慾望?維持神經元活躍?記憶鞏固?性心理願望滿足?無人知曉。就連弗洛伊德也曾坦言:“有時雪茄就只是雪茄。”
如今,人工智能及其模仿大腦的神經網絡正為解夢提供新線索。1968年,菲利普·K·迪克出版小説《仿生人會夢見電子羊嗎?》——1982年電影《銀翼殺手》正是基於此作。事實證明答案是肯定的。
首先快速瞭解神經網絡的簡化原理:其數字層由互聯節點組成,模擬人腦神經元與突觸連接,擅長識別模式。當掃描數百萬張照片後,某層節點可能通過數值權重判定,帶有眼睛、鼻子和嘴的圓形物體是人臉。數據隨後傳遞至下一層,該層會識別模式中的模式,比如判斷這是貓臉或狗臉。接着另一層繼續識別模式的模式,最終能確定狗的品種是西伯利亞雪橇犬。如此層層遞進。
可訓練神經網絡的理論早在1943年就已提出,但直到1958年心理學家弗蘭克·羅森布拉特在康奈爾航空實驗室展示感知機時才真正問世。然而直到過去十年間,人工智能才真正實現規模化應用,獲得了理解人類語音和識別照片中人臉的能力。
是什麼帶來了改變?更快的處理器和更廉價的內存固然功不可沒,但過去的神經網絡常因"過擬合"數據而陷入誤區——比如判定所有長着貓眼的東西都是貓,或是得出恐龍建造了巨石陣的結論。人類也會犯類似錯誤:因為球隊上次獲勝時我們敲了木頭或穿了幸運襪,就認定這些行為與勝利相關。計算機可能像人類一樣產生迷信。
1970年芬蘭學生塞波·林納因馬提出了"反向傳播"算法(此處仍屬過度簡化),即通過神經網絡層反向傳遞誤差來調整權重參數,從而更好地識別模式。但直到1986年《通過反向傳播誤差學習表徵》論文發表(合著者包括神經網絡研究先驅傑弗裏·辛頓),反向傳播研究才真正起飛。該方法又經過20年才實現規模化應用,這就是當今語音和麪部識別AI表現優異的原因。
最新理論進展:2020年時任塔夫茨大學教授的神經科學家埃裏克·霍爾提出,人類大腦同樣會陷入過擬合困境,需要通過泛化來解決問題。霍爾認為大腦"通過每晚經歷光怪陸離的夢境來實現這一點"。他提出假説認為"夢境本質上是被刻意扭曲的輸入信號,可能源自大腦層級結構中注入的噪聲"。聽起來很熟悉?沒錯,或許夢境正是通過注入噪聲和錯誤來進行反向傳播,打破我們固有的模式識別框架。這就能解釋為何夢境總是如此荒誕離奇。
霍爾先生甚至寫道,也許"小説、電影等虛構作品就像人工夢境,至少能部分實現同樣的功能",即注入噪音和錯誤。這倒是個不錯的一口氣看完漫威電影宇宙31部(還在增加)電影的理由。或許有一天虛擬現實能部分替代那些怪夢,治癒睡眠不足。
神經網絡面臨的另一個問題是"災難性遺忘"——新數據會覆蓋舊信息。加州大學聖地亞哥分校醫學院睡眠研究員馬克西姆·巴熱諾夫最近發表的論文指出:“人腦持續學習並將新數據整合到現有知識中”,且"當新學習與睡眠記憶鞏固期交替進行時效果最佳"。他認為人工智能神經網絡同樣如此——適當休眠能讓它們學得更好。或許這就是微軟將其必應聊天機器人回覆限制在20條以內的原因。關於最新版本ChatGPT 4的早期評價顯示,它更準確但缺乏創造力。也許它需要好好睡一覺。
在過擬合與災難性遺忘之間,我們的大腦需要將新經歷與舊記憶融合而不遺忘過去。我曾聽國際象棋冠軍馬格努斯·卡爾森講述他用自己多年前發佈的象棋程序對戰年輕時的自己的故事。他説這感覺有點超現實,但看着自己的進步軌跡實在令人着迷。或許這就是我們會做夢的原因——不是為了抹去舊記憶,而是為了弱化並微調它們,從而獲得成長與進步。通過ChatGPT和人工智能研究,我們將更深入地瞭解自己。祝你好夢。
刊登於2023年4月3日印刷版,標題為《甜美的夢,ChatGPT》。