物理 + 人工智能 = 2024年諾貝爾物理學獎!_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!10-16 11:06
作者:原理
在我們今天的生活中,人工智能可以説是無處不在,從聊天機器人到自動駕駛,再到人臉識別,它推動着許多科技的創新。而這場人工智能革命的核心,是一種叫做人工神經網絡機器學習的技術。10月8日,2024年諾貝爾物理學獎授予了該領域的兩位先驅:約翰·霍普菲爾(John J. Hopfield)德和傑弗裏·辛頓(Geoffrey E.Hinton)。
接下來就讓我們來聊聊神經網絡,以及這次諾獎背後的物理學原理。
人工智能的神經網絡技術最初是受到人腦結構的啓發。人腦由數十億個神經元組成,這些神經元通過突觸相互發送信號。每個神經元都與成千上萬的其他神經元相連,形成一個複雜的網絡,構成我們的思想、記憶和行動的基礎。
人工神經網絡則是基於計算機的模擬,來模仿這種生物結構。在人工神經網絡中,神經元被“節點”所替代。節點是處理信息的基本單位,可以有不同的值,比如1或0。而突觸則由節點之間的“連接”表示,這些連接可以增強或減弱。
在1982年的時候,霍普菲爾德開發了一種人工神經網絡,可以用來儲存和重建模式或圖像。霍普菲爾德的靈感來自於他對磁性材料和原子自旋的理解。自旋是粒子的一個基本量子屬性,它使每個原子的行為像一塊小磁鐵,可以指向不同的方向,比如向上或向下。相鄰原子的自旋可以對齊(指向相同方向)或不對齊(指向相反方向)。這些自旋間的相互作用影響了整個系統的能量。在磁性材料中,如果相鄰原子的自旋對齊,系統就會達到較低的能量狀態,這樣就會更加穩定。相反,如果自旋不對齊,系統的能量就會增加,這樣的狀態則不太穩定。在磁性材料中,形成自旋方向一致的區域,被稱為磁疇。磁疇代表了系統試圖讓能量最小化的嘗試。
而霍普菲爾德神經網絡的保存和檢索圖像的能力就依賴於能量最小化原理。在霍普菲爾德神經網絡中,網絡的結構類似於一個由自旋組成的物理系統,每個節點的行為就像一個原子的自旋——它可以處於兩種狀態中的一種,比如+1或-1,類似於自旋向上或向下。節點之間的連接表示材料中自旋如何相互影響。
在這個網絡中,節點狀態的每種可能配置——無論是代表部分圖像還是完整圖片——都有一個與之相關的特定能級。當我們訓練網絡記住某些模式(或圖像)時,網絡會調整節點之間的連接強度來“學習”這些模式。每個儲存的模式或圖像對應於網絡的一個特定配置,也就是一個穩定的、低能量的狀態。
所以,當你給網絡一個扭曲或不完整的圖像時,它會從一個更高的能量狀態開始。然後網絡有條不紊地遍歷節點並逐個更新它們的值,每次更新的目的都是減少網絡的總能量,直到它進入一個穩定的低能量狀態。通過這種方式,網絡會“識別”並重建原始圖像。
這就好比當我們看到一個朋友的照片時,儘管照片可能很模糊,但還是能認出來。因為我們的大腦會根據儲存的記憶來填補缺失的細節。類似地,霍普菲爾德神經網絡可以通過進入代表記憶的最低能量狀態,從部分信息中回憶起完整的記憶。
然而,霍普菲爾德神經網絡在學習更復雜的模式方面存在侷限性。到了1985年,辛頓擴展了霍普菲爾德的想法,他基於統計物理學的思想開發了玻爾茲曼機(Boltzmann Machine)。
統計物理學是物理學的一個分支,它研究的是由大量粒子(比如氣體中的原子)組成的系統。在這樣的系統中,由於粒子的數量龐大且不斷在運動,跟蹤每個單獨的粒子是不切實際的。所以,物理學家研究的是它們的集體行為,來了解系統的總體特性。統計物理學使用概率來理解不同的狀態是如何分佈的,以及如何將能量最小化以達到穩定的狀態。
那麼玻爾茲曼機是怎麼運作的呢?讓我來舉一個例子。
當你在刷朋友圈時,你恰好看到了你的朋友發了一張全家福。即使你從未見過你朋友的家人,你仍然可以根據他們的共同特徵,比如面部特徵,立即分辨出你們是一家人。類似的,玻爾茲曼機就像我們的腦,經過訓練它就可以識別人臉的模式。
在玻爾茲曼機中,神經網絡有兩層節點。一層是由可見節點組成的“可見”層,用於輸入數據,比如眼睛、鼻子或微笑等特徵。另一層是由隱藏節點組成的“隱藏”層,它會試圖理解輸入中的潛在模式。
當玻爾茲曼機得到一個新的輸入,比如你朋友的家人出現時,它可能會以一個與之前學習過的任何模式都不完全匹配的配置開始。這類似你最初對你朋友和你朋友的家人的相似度的不確定。當玻爾茲曼機處理輸入時,它會更新其節點,類似於大腦接收到你朋友的家人的更多細節。這個更新過程涉及概率計算,機器評估每個節點狀態的可能性,比如某個特徵是否與你朋友相似。
每次機器更新一個節點的狀態,它的目標是降低系統的整體能量。較低的能量狀態對應於更接近學習模式的配置。比如你的大腦在處理更多細節後,就會減少對你朋友家人身份的不確定性,逐漸對自己的評估更有信心。玻爾茲曼機會逐步更新,直到它進入一個低能量狀態,這代表了一個與儲存模式密切一致的配置。
簡而言之,玻爾茲曼機利用了能量最小化原理,通過迭代更新從較高的能量狀態過渡到較低的能量狀態,使其能夠以類似於我們自己的認知過程的方式有效地學習和識別複雜模式。這種從例子中學習並生成新的類似數據的獨特能力使玻爾茲曼機成為人工智能和神經網絡發展的一個重要里程碑。
今天,機器學習的發展已經帶來了巨大的影響,它不僅讓我們的生活變得更加智能,也被應用在了許多科學領域。例如,它可以幫助我們尋找系外行星,分析來自粒子加速器產生的海量數據,以及計算蛋白質分子的結構等等。
我們完全有理由期待,未來人工智能或將在科學領域掀起更大的革命。
審核:高興宇,中國科學院微電子研究所研究員
本文為科普中國·創作培育計劃扶持作品
出品:中國科協科普部
監製:中國科學技術出版社有限公司、北京中科星河文化傳媒有限公司