深度學習解決計算量子化學基本問題,探索物質與光如何相互作用_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!10-15 13:53
當分子和材料受到大量能量的刺激時,電子可能會躍遷到更高能量的激發態。激發態對理解物質如何與光相互作用至關重要。在此前的研究中,DeepMmind 團隊開發了神經網絡架構 FermiNet,利用深度學習從第一性原理計算原子和分子的能量。近日,研究團隊將這項工作拓展到激發態的計算中,在 Science 上發表用神經網絡計算量子激發態的突破性工作,該方法比以往的方法更穩健和通用。
撰文 | David Pfau,James Spencer
翻譯 | 龔銘康
論文題目:
Accurate computation of quantum excited states with neural networks
論文地址:
https://www.science.org/doi/abs/10.1126/science.adn0137
2020年發表於 Physical Review Research 上的文章展示了深度學習如何幫助解決現實系統中的量子力學基本方程。這不僅是一個重要的基礎科學問題,也可能在未來帶來實際應用,使研究人員能夠在實驗室實際製造之前,通過計算機模擬來原型化新材料和化學合成。
論文題目:Ab initio solution of the many-electron Schrödinger equation with deep neural networks
論文地址:https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.2.033429
神經網絡架構 FermiNet(Fermionic Neural Network,費米子神經網絡)非常適合模擬大量電子的量子態,電子是化學鍵的基本組成部分。FermiNet 是第一個利用深度學習從第一性原理計算原子和分子能量的示例,並且其精度足夠高,具有實際用途。而我們基於自注意力機制的新架構 Psiformer 迄今為止仍然是最精確的人工智能方法。我們將 FermiNet 加入到蛋白質摺疊、玻璃態動力學、晶格量子色動力學等許多項目中,希望在人工智能研究中開發的工具和理念能夠幫助解決基礎科學問題。
量子力學歷史的簡單回顧
提到“量子力學”,你可能感到困惑。這個詞彙讓人聯想到薛定諤的貓,這隻貓悖論般地既可以是活着的,也可以是死去的,還有那些既是粒子又是波的基本粒子。在量子系統中,像電子這樣的粒子不像經典描述那樣有一個確切的位置。相反,它的位置是由一個概率雲描述的——它分佈在所有可能存在的地方。這種反直覺的狀態讓理查德·費曼(Richard Feynman)宣稱:“如果你認為你理解了量子力學,那你就不理解量子力學。”
儘管這種詭異的現象讓人迷惑不解,但該理論的核心可以簡化為幾條簡單的方程。其中最著名的是薛定諤方程,它在量子尺度上描述粒子的行為,正如牛頓運動定律描述我們熟悉的人類尺度下物體的行為一樣。雖然對這個方程的解釋可能會引發無盡的困惑,但其數學部分相對易於處理,這也促使教授們在面對學生尖鋭的哲學提問時常常會説:“Shut up and calculate!”(“閉嘴,算就完了!”)
這些方程足以描述我們周圍所有熟悉的物質在原子和原子核層次上的行為。它們的反直覺性質導致了各種奇異現象:超導體、超流體、激光和半導體的存在都是量子效應的結果。而即便是普通的共價鍵——化學的基本構成單元——也是電子量子相互作用的產物。
這些規則在 1920 年代被提出後,科學家們意識到他們第一次擁有了一個關於化學如何運作的詳細理論。理論上,他們只需為不同的分子建立這些方程,計算出系統的能量,便可以知道哪些分子是穩定的,哪些反應會自發發生。然而,當他們實際着手計算這些方程的解時,發現他們只能精確地計算出最簡單的原子(氫原子)的解,而幾乎無法處理其他任何原子,它們都過於複雜。
“物理學和整個化學領域的數學理論所必需的基本物理定律已經完全為人所知,唯一的困難是這些定律的精確應用會導致方程過於複雜而無法求解。因此,開發應用量子力學的近似實用方法成為當務之急。”
——保羅·狄拉克(Paul Dirac),量子力學奠基者,1929年
但許多人接受了狄拉克的挑戰。物理學家們很快建立了數學技術,能夠近似描述分子鍵和其他化學現象的定性行為。這些方法基於對電子行為的近似描述。在這種描述中,每個電子被分配到一個特定的軌道,軌道給出電子在原子核附近任何一點被發現的概率。每個軌道的形狀依賴於所有其他軌道的平均形狀。由於這種“平均場”描述將每個電子僅分配到一個軌道上,因此它並沒有全面地展現電子的實際行為。儘管如此,它仍足以在大約 0.5% 誤差內估算分子的總能量。
不幸的是,0.5% 的誤差對於實際工作的化學家來説仍然不夠有用。分子鍵中的能量只佔系統總能量的極小一部分,正確預測一個分子的穩定性通常可能只取決於總能量的 0.001%,或者大約 0.2% 的“關聯”能量。例如,在丁二烯分子中,電子的總能量接近每摩爾 100,000 千卡,但不同分子形狀之間的能量差異僅為每摩爾 1 千卡。這意味着如果你想正確預測丁二烯的自然形態,那麼所需的精度就相當於以毫米為單位測量足球場的寬度。
二戰後,隨着數字計算的出現,科學家們開發了許多超越這種電子“平均場”描述的計算方法。雖然這些方法通常由各種縮寫詞表示,但它們大致可以歸為在精度和效率之間進行權衡的方法的不同極端。一端是精確的計算方法,其計算複雜度隨電子數量呈指數級增長,因此除最小的分子外,這些方法都無法實際應用。另一端則是線性擴展的方法,但精度不高。這些計算方法對化學實踐產生了巨大影響——1998年諾貝爾化學獎頒發給了這些算法的創始人。
費米子神經網絡
儘管現有的計算量子力學工具種類繁多,我們認為仍然需要一種新方法來解決高效表示的問題。即使是最粗略的方法,最大的量子化學計算也僅能處理數萬電子,而經典的化學計算技術如分子動力學可以處理數百萬個原子。
經典系統的狀態可以很容易地描述——我們只需跟蹤每個粒子的位置和動量。描述量子系統的狀態則困難得多,需要為每種可能的電子位置構型賦予一個概率。這種構型編碼在波函數中,波函數為每種電子構型分配一個正或負數,波函數的平方給出了系統處於該構型中的概率。
所有可能構型的空間是巨大的——如果你嘗試用每維100個點來表示,那麼對於硅原子來説,可能的電子構型數量將超過宇宙中的原子數量。這正是我們認為深度神經網絡(deep neural networks)可以發揮作用的地方。在過去幾年裏,使用神經網絡表示複雜的高維概率分佈取得了巨大進展。我們現在知道如何高效且可擴展地訓練這些網絡,並猜測鑑於這些網絡能夠在人工智能問題中擬合高維函數,或許它們也可以用來表示量子波函數。
此前的研究展示了現代深度學習如何用於解決理想化的量子問題。我們希望使用深度神經網絡來解決化學和凝聚態物理中更現實的問題,這意味着我們必須在計算中考慮電子。
處理電子時只有一個小難點。電子必須遵守泡利不相容原理(Pauli exclusion principle),不能同時處於同一個空間。這是因為電子是一種稱為費米子(fermions)的粒子,這類粒子包括大多數物質的組成部分:質子、中子、夸克、中微子等。它們的波函數必須是反對稱的。如果交換兩個電子的位置,波函數就會乘以-1。這意味着如果兩個電子重合,波函數(以及該構型的概率)將為零。
這意味着我們必須開發一種對輸入具有反對稱性的神經網絡,我們稱之為 FermiNet。在大多數量子化學方法中,反對稱性是通過一種稱為行列式(determinant)的函數引入的。矩陣的行列式具有這樣的性質:如果交換兩行,輸出就會乘以-1,正如費米子的波函數一樣。因此,你可以取一組單電子函數,對系統中的每個電子進行評估,並將所有結果打包成一個矩陣。該矩陣的行列式便是一個適當的反對稱波函數。這種方法的主要侷限性在於,所得出的函數——稱為斯萊特行列式(Slater determinant)——並不具備廣泛適用性。
真實系統的波函數通常要複雜得多。改善這種情況的典型方法是採用大量斯萊特行列式的線性組合——有時可能是數百萬個或更多——並基於電子對進行一些簡單的修正。即便如此,這也可能不足以精確計算能量。
深度神經網絡通常在表示複雜函數方面比線性組合的基函數更加高效。在 FermiNet 中,這是通過將每個進入行列式的函數設定為所有電子的函數來實現的。這遠遠超越了僅使用一電子和二電子函數的方法。FermiNet 為每個電子提供了獨立的信息流。如果這些信息流之間沒有相互作用,該網絡的表現力將不會超過傳統的斯萊特行列式。
為了超越這一點,我們在網絡的每一層對所有信息流的信息進行平均,並將這些信息傳遞給下一層的每個信息流。這樣,這些信息流就具有了正確的對稱性質,從而創建一個反對稱函數。這類似於圖神經網絡在每一層匯聚信息的方式。與斯萊特行列式不同,FermiNet 是通用函數逼近器,至少在神經網絡層足夠寬時是這樣的。這意味着,如果我們能夠正確地訓練這些網絡,它們應該能夠擬合接近精確的薛定諤方程解。
我們通過最小化系統的能量來擬合 FermiNet。要精確地做到這一點,需要在所有可能的電子構型下評估波函數,因此只能進行近似計算。我們隨機選擇一些電子構型,局部評估每種電子排列下的能量,彙總每種排列的貢獻並最小化它,而不是最小化真實能量。這被稱為蒙特卡洛方法(Monte Carlo method),因為它有點像賭徒不斷擲骰子。雖然它是近似的,但如果我們需要更精確,可以再次擲骰子。
由於波函數的平方給出了觀察到粒子在任意位置排列的概率,因此最方便的做法是直接從波函數中生成樣本——本質上是在模擬觀察粒子的行為。雖然大多數神經網絡是從某些外部數據中訓練的,但這裏用來訓練神經網絡的輸入數據是由神經網絡自身生成的。這意味着除了電子繞原子核“跳舞”的位置外,不需要其他訓練數據。
這一基本思想被稱為變分量子蒙特卡洛法(variational quantum Monte Carlo,簡稱VMC),自60年代以來一直存在,通常被認為是一種計算系統能量的廉價但不太精確的方法。通過用 FermiNet 取代基於斯萊特行列式的簡單波函數,我們在所有研究的系統上顯著提高了這一方法的精度。
為了確保 FermiNet 代表了當前技術的進步,我們首先研究了一些簡單且被深入研究過的系統,比如元素週期表第一週期的原子(從H到Ne)。這些都是小型系統——電子數量少於10——足夠簡單,可以用最精確(但規模呈指數增長)的方法來處理。
FermiNet 的表現遠遠超過了相對的 VMC 計算——通常能將相對於指數擴展計算的誤差減少一半甚至更多。在較大的系統中,指數擴展方法變得難以處理,因此我們改用耦合簇方法(coupled cluster method)作為基準。該方法在分子處於穩定構型時效果很好,但在鍵被拉伸或斷裂時表現不佳,而這對理解化學反應至關重要。雖然其擴展方式比指數擴展好得多,但我們使用的特定耦合簇方法的規模依然隨着電子數量的七次方增長,因此它只能用於中等尺寸的分子。
我們將 FermiNet 應用於逐漸增大的分子,首先從氫化鋰開始,逐步研究到雙環丁烷,這是我們研究的最大系統,包含30個電子。在最小的分子中,FermiNet 捕獲了耦合簇能量與單一斯萊特行列式能量之間驚人的 99.8% 差異。在雙環丁烷中,FermiNet 仍捕獲了 97% 或更多的關聯能量,對於這樣一種簡單的方法來説,這是一個巨大的成就。
雖然耦合簇方法在穩定分子中表現良好,但計算化學的真正前沿是在理解分子的拉伸、扭曲和斷裂過程上。在這些方面,耦合簇方法常常會遇到困難,因此我們必須與儘可能多的基準進行比較,以確保得到一致的答案。
在這兩個系統中,耦合簇方法在平衡狀態下表現良好,但在鍵被拉伸時出現了問題。傳統的 VMC 計算整體表現不佳,但無論鍵長如何變化,FermiNet 都是調查的最佳方法之一。
計算激發態的新方法
2024年8月,我們在《科學》雜誌上發表了這項工作的下一階段成果。我們的研究提出了一種解決計算量子化學中最困難挑戰之一的方案:理解分子在受到刺激時如何從基態轉變到激發態,或反過來。
FermiNet 最初專注於分子的基態,即給定原子核周圍的電子最低能量構型。但當分子和材料受到大量能量的刺激時,例如暴露於光照或高温下,電子可能會躍遷到更高能量的構型——即激發態。
激發態對理解物質如何與光相互作用至關重要。吸收和釋放的能量精確值為不同的分子和材料創造了獨特的“指紋”,這會影響從太陽能電池板和 LED 到半導體、光催化劑等各種技術的性能。它們還在涉及光的生物過程(如光合作用和視覺)中發揮關鍵作用。
精確計算激發態的能量比計算基態能量要困難得多。即使是基態化學中的黃金標準方法(如耦合簇),在激發態的計算中也會出現幾十倍的誤差。儘管我們希望將 FermiNet 的工作擴展到激發態,但現有方法不足以讓神經網絡與最先進的方法競爭。
我們開發了一種計算激發態的新方法,比以往的方法更穩健和通用。該方法可以應用於任何類型的數學模型,包括 FermiNet 和其他神經網絡。它的工作原理是通過在一個擴展的系統中引入額外的粒子來找到基態,從而可以對現有的優化算法進行較少的修改後使用。
我們在廣泛的基準測試中驗證了這項工作,並獲得了非常有前景的結果。在一種小而複雜的分子——碳二聚體(carbon dimer)中,達到了平均絕對誤差(MAE)為 4 meV 的結果,比之前的黃金標準方法 20 meV 更接近實驗結果。我們還在計算化學中一些最具挑戰性的系統中測試了該方法,這些系統中有兩個電子同時被激發,結果發現誤差在 0.1 eV 範圍內,這與迄今為止最複雜的計算相匹配。
我們將最新的工作開源,並希望研究界能基於我們的方法,探索物質與光相互作用的新奇方式。
本文經授權轉載自微信公眾號“集智俱樂部”。原文鏈接:https://deepmind.google/discover/blog/ferminet-quantum-physics-and-chemistry-from-first-principles/
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。