“最大的障礙來自物理學界”,MIT物理學家反思AI與物理的結合_風聞
返朴-返朴官方账号-科普中国子品牌,倡导“溯源守拙,问学求新”。30分钟前
在一次採訪中,美國國家科學基金會(NSF)人工智能和基本相互作用研究所(IAIFI)主任傑西·塞勒(Jesse Thaler)暢談了AI和物理學富有成效的交叉。他分享了自己從機器學習懷疑者轉變為倡導者的思想轉變經歷,並分析了AI與物理學雙向互動可能帶來新發現的潛在路徑。
撰文 | FirstPrinciple
翻譯 | 1/137
傑西·塞勒(Jesse Thaler) 圖源:Jared Charney
傑西·塞勒(Jesse Thaler)是麻省理工學院(MIT)理論粒子物理學家[1],他尋求通過將量子場論和機器學習(machine learning)的技術相結合,來解決基礎物理學中懸而未決的重要問題。他還是美國國家科學基金會(NSF)人工智能和基本相互作用研究所IAIFI(Institute for Artificial Intelligence and Fundamental Interactions)[2]的主任。
IAIFI於2020年成立,獲得了NSF為期五年的資助,旨在將波士頓地區探索人工智能(AI)問題、物理學問題及其交叉領域的人才聚集在一起。
最近,FirstPrinciples(以下簡稱FP)就人工智能與基礎物理學交叉領域的挑戰與機遇,以及IAIFI研究人員正在進行的工作等問題採訪了塞勒(以下簡稱JT)。他分享説,就在不久前,他的學生還不得不説服他“從機器學習的‘老學究’變成機器學習的‘佈道者’”。他甚至開玩笑説,這次採訪的後續問題可以直接向ChatJesseT[3]提出(見下圖),這是他的學生和博士後專為愚人節而創作的ChatGPT搞笑版。
為清晰起見,採訪內容經過刪節和編輯。
FP: 你能談談IAIFI的成立以及你是如何參與其中的嗎?
JT:我是一名理論物理學家。我曾在蘇黎世參加一個活動,當時一羣從事理論粒子物理的朋友剛開始使用機器學習。我開玩笑説:“深度學習?我們是理論物理學家,應該做深度思考!”這個玩笑最終成了IAIFI的標語:深度學習+深度思考=更深入的理解(Deep learning + Deep thinking = Deeper understanding)。人工智能和物理學其實是一條雙向道:一方面是AI對我們研究新物理現象的影響,另一方面是將物理學的思維方式應用於AI系統的運行。
那是2016年7月,我剛開了這個玩笑,同年9月,兩位出色的研究生就帶着他們碩士期間寫的一篇論文來到我的辦公室,試圖説服我。我所做的那種第一性原理研究與高等計算、統計推理(Statistical reasoning)、計算機科學和AI等方法之間確實存在協同效應。
我明確地告訴他們,我認為物理學研究不應該朝着這個方向發展,即只是做機器學習的現成應用。而他們實際上也同意我的觀點。他們的博士研究真正關注的是將物理原理注入AI,並教會機器像物理學家一樣思考。
從某種意義上説,IAIFI是為帕特里克·科密斯克(Patrick Komiske)和埃裏克·梅託迪夫(Eric Metodiev)這些學生建立的,因為我意識到在AI和物理學之間的交叉領域上,當時並沒有真正的職業發展機會。它曾是(並將繼續是)一個新興領域。如果有人想深入研究物理學的主題,但也想研究計算和統計學,那麼他們在學術生態系統中該如何定位呢?這就是向NSF申請資助以創辦該研究所的動機。
美國國家科學基金會人工智能和基本相互作用研究所於2020年啓動 圖源:IAIFI
FP:你認為這個交叉領域有哪些令人激動的機會?
JT: 如果只將AI應用於基礎物理學研究,那麼這一領域面臨着巨大的挑戰,我們正在努力理解自然界中一些最深層次的問題。
也許並非人盡皆知的是,在2012年發現希格斯玻色子的背後有大量的機器學習算法在發揮作用。大型強子對撞機(Large Hadron Collider,LHC)會產生海量數據。為了篩選這些數據,機器學習現在是數據分析的一個非常標準的部分。如今,機器學習正逐漸從淺層學習轉向深度學習。我們甚至開始看到生成式(Generative)AI在影響我們對物理分析的思考方式。
宇宙學是另一個擁有海量數據的領域,並且運行宇宙的模擬需要巨大計算成本。如果沒有機器學習這樣的技術,我們根本無法處理這些問題。
中微子實驗提供了又一個例子。美國正在大力投資一種名為“液氬時間投影室”(Liquid Argon Time Projection Chambers, LArTPC)的探測器技術。這有點像是回到了氣泡室(bubble chamber)時代[4],那時人們會查看粒子相互作用的單個圖像——只不過現在這些圖像(數據)隨着束流(beam)的每一次“傾瀉”而快速、密集地出現。你不可能人工逐一查看這些圖像,但你需要類似人類的推理能力來弄清楚發生了什麼。在這種情況下,如果沒有機器學習幫助我們篩選這些信息,這項技術甚至無法運行——這正是AI在基礎物理研究中顯得絕對必要的一個例子。
2024 年度諾貝爾物理學獎獲得者約翰·霍普菲爾德(John Hopfield)和傑弗裏·辛頓(Geoffrey Hinton)圖源:Ill. Niklas Elmehed © Nobel Prize Outreach
至於物理學如何應用於AI,這一點可能並不那麼顯而易見。為什麼物理學能夠幫助我們理解AI系統呢?當然,隨着最近諾貝爾獎的揭曉[5],這種聯繫或許更容易解釋了。我們至少看到了四種物理學對AI產生影響的方式。
第一種是將物理學融入現有的AI系統。例如,如果你想讓一個機器人在某個環境中導航,你會希望教它一些關於物理系統、三維空間以及旋轉對稱性等方面的知識。甚至一些利用AI實現的強大計算機圖形效果,也依賴於光線追蹤(ray tracing)技術,它基於描述光如何傳播的物理學原理。
第二種是物理學為AI提供支持,源自物理學的概念可以幫助你構建更好的AI工具,即便並不是直接研究物理系統。你可以設計出嵌入了物理學思維方式的機器學習架構,而這些概念被證明是非常強大的。
然後,還有AI的物理學(physics of AI),即把AI當作一個真正的物理系統來思考。例如,相變(phase transitions)是物理學家非常熟悉的一個概念。AI並非只是一種單一的存在。由於你可以通過調整機器學習算法中的超參數(hyperparameter)來改變其行為,因此AI可以表現出不同的“相”(phase)。隨着對這些超參數的調整,AI會經歷不同的“相”,學習方式也會隨之改變。IAIFI的研究人員正在探索這方面,他們考慮使用物理學分析工具來理解AI。
最後,物理學正在推動AI實現一些連AI專家都未曾想過其算法能夠做到的事情。宇宙學是一個多尺度(multi-scale)問題,其動力學發生於宇宙作為一個整體的層面,還要逐步聚焦,直到個體星系的層面。如何處理這些不同尺度上的現象?這確實是將 AI 算法推向了極限,因為很多AI都是為文本處理或圖像識別而設計的,這種多尺度的性質並不那麼明顯。
FP:與物理學的某些子領域相比,IAIFI 科學家所從事的領域正在以驚人的速度發生變化。這種快速變化,帶來了哪些獨特的挑戰或機遇?
JT: 嗯,這絕對需要我們以不同的方式思考問題。作為一名理論物理學家,我的主要工具箱是量子場論。你可能會問,“量子場論怎麼可能從AI中受益?”量子場論基於嚴格的計算,而關於AI的固有印象往往是,“哦,AI會產生幻覺。”在需要嚴格計算的情景中怎麼使用AI呢?
你必須創造性地思考如何做到這一點。我的一位IAIFI同事正在研究簡化理論表述。眾所周知,計算量子散射振幅(quantum scattering amplitude)的傳統方法需要成堆的草稿紙,但如果簡化它們,(這些計算)可以壓縮到一行。實際上,弄清楚這種壓縮是非常具有挑戰性的,因為你面對的是具有非常複雜性質的特殊函數。
有了大型語言模型,我們已經知道如何總結文本。利用這種文本總結的方法來進行方程的總結也並非難事。因為你知道其中的規則,你可以讓AI輸出它用於簡化方程的規則,然後驗證這些規則是否真正有效。機器學習為我們提供了一種啓發式的方法,使我們能夠在有限的計算時間內得到合理的答案。
盲人摸象 圖源:wiki
在我的研究中,我一直在嘗試整合不同類型的理論計算。這有點像盲人摸象的故事,只不過這裏的“象”是一個大家爭相追逐的基礎物理計算。你可能無法直接計算它,但可以在特定極限情況下做一些計算——你可以計算大象鼻子,也可以計算大象尾巴,然後找到一種方法將它們合而為一。
我能否將這種整合過程轉化為一個優化問題(optimization problem)?如果可以,而且能夠用這種語言重新表達我的問題,那麼機器學習就提供了一種解決方案。而我的責任在於弄清楚這個解決方案意味着什麼。這要求我得像機器一樣思考。如果我能做到這一點,那麼我就能完成一些僅靠紙筆計算無法完成的事情。
FP:創造力並不是通常與AI聯繫在一起的東西。
JT:是的。我們通常認為創造力是人類大腦的一種特殊能力。但我認為,從ChatGPT那裏我們學到,通過窮舉搜索(exhaustive search)也可以獲得一種創造力。我其實真的不太明白它是如何工作的。但也許,我們需要思考過去的發現,哪怕只是作為一個思想實驗,包括像愛因斯坦的廣義相對論這樣基礎性的理論。我們是否可以通過對理論可能性空間(space of theoretical possibilities)的窮舉搜索來發現它?對這個問題,是否存在一種解決方案,而不需要這種靈光乍現的洞察力飛躍?
我覺得還沒有人真正成功做到這一點。但已經有跡象表明,數值和文本數據之間的聯繫可能比人們想象的要緊密得多。可以想象我們進行這樣的對話,在未來——尚不清楚是1年後還是10年後——人們通過用AI的語言來表述問題,從而提出新的概念性突破。那將是非常令人興奮的。
FP:你提到了ChatGPT,生成式AI已成為公眾意識中普遍存在的話題。這種興趣的激增使IAIFI研究人員的工作更輕鬆,還是更困難?
JT: 因為我們所做的工作與研究本身更根本的好奇心有關,所以我們沒有(至少直接地)面臨一些關於AI的社會擔憂,儘管我們非常清楚我們為基礎物理學應用開發的技術可能會進入社會應用領域。
倫理學中也存在算法的一面,即通過計算工具來做出決策。我的一位從事實驗研究的同事曾嘗試設計一種算法,使其能夠做到無偏(unbiased)收集LHC數據。當然,這種去偏(de-biasing)的方法也適用於更廣泛的社會應用。他實際上將他的工具應用於一些基準醫學影像和監禁數據集(incarcerationdata sets)[6],並發現其性能優於其他方法。
我認為最難向人們解釋的是,這些算法本質上是概率性的(probabilistic)。每次在ChatGPT中輸入一個提示詞(prompt),你都會得到不同的答案。作為一名物理學家,這對我來説是非常常見的。我的意思是,量子力學就是這樣的。統計推理是我們所做工作的核心,至少在現代物理學中是這樣。
很多時候,最大的障礙來自我們物理學界。許多物理學家並不接受AI,部分原因是他們不瞭解它能做什麼,或者只將其與深度視頻偽造(deepfake video)聯繫在一起。現成的AI並不適合物理學的應用。但通過適當的調整,你可以擁有與傳統方法一樣穩健的AI系統。
至於要説服他們,最好的方法和當初説服我的方式一樣。需要一個年輕人走進你的辦公室,展示AI能做什麼——它能滿足我們習慣的科學嚴謹性的標準,並且它還能回答你從未想過能用傳統方法解決的問題。我們真的需要通過一次又一次的交流來説服那些持懷疑態度的同事。
我不認為人工智能會消失。作為科學家,我們不能像鴕鳥一樣把頭埋在沙子裏。我們需要開始理解這些系統的工作原理,特別是為科學界設計AI系統。現成的AI並不完全適用於科學發現,但它已經很接近了。我們可以通過與計算機科學界的協作,推動兩個領域的發現。
FP:你能談談IAIFI與政府和產業界的聯繫嗎,為什麼這些聯繫很重要?
JT:IAIFI的研究人員主要研究的是好奇心驅動的問題。但是,好奇心驅動的科學和應用項目驅動的科學之間存在着一個連續體,從黑板上開始的想法最終可以進入消費者手中。
目前,AI相關的討論主要由消費級應用或行業應用推動,但與其他領域的專家交談可以獲益良多——不僅僅是物理學,還有哲學、歷史、宇宙學、化學、生物學以及地球和行星科學等等。它們中每一個領域都有自己的數據框架和相應的理解,如果它們參與到對話中,則可以獲得有益的見解。
我去了國會山並與工作人員進行了交流。每個人都需要對AI有所瞭解,但也需要明白AI在不同領域有着不同的表現形式。至少,我們所有人都必須從教育的角度去思考它。我有一個12歲的兒子,所以我非常清楚他可能會啓動一個聊天機器人來完成他的作業。擁有不同領域的視角是非常重要的。我們正在努力讓物理學界的聲音被聽到,而不僅僅是那些大型公司的聲音。
FP: IAIFI最初的五年投資大約已經進行了四年。你認為該研究所到目前為止取得了哪些成就?你對它的未來有何設想?
2024 IAIFI 暑期學校的學員 圖源:IAIFI
我真的很自豪我們已經將“AI+物理”確立為人們認可的領域。我們的IAIFI博士後獎學金取得了巨大的成功。實際上,我們的第一輪研究員,也有我們第二輪的部分研究員將繼續在工業界和學術界工作。他們正在從事的工作是以前並不真正存在的。有兩個具有物理學背景的研究員被計算機科學系聘用的例子,看到這樣的發展真的很令人興奮。我希望物理系最終也能僱用具有更多計算機科學背景的人。它需要是一條雙向的道路。
具體而言,我們正在努力爭取讓IAIFI獲得NSF的續期資助。更廣泛地説,我們的願景是將我們已經開展的“AI+物理學”的工作擴展到“AI+科學”,強調科學發現的方式將會改變,每個領域都有能力為這一變革做出貢獻。
至於到底會是什麼樣子呢?我們將拭目以待,看看是持續的政府支持,還是來自基金會支持或私人慈善捐贈。但我的希望是,五年後,你會看到在這個跨學科領域中出現更多的職位(以及更多的突破)。
譯者注
[1]參見Jesse Thaler在MIT的主頁:https://physics.mit.edu/faculty/jesse-thaler/。
[2]參見:https://iaifi.org/。
[3]可訪問:https://chatjesset.com/。
[4]氣泡室是1952年美國物理學家格拉澤(Donald Arthur Glaser, 1926-2013)發明的。它曾給高能物理實驗帶來許多重大的發現。格拉澤因此獲得了1960年諾貝爾物理學獎。
[5]本文首發於2024年11月。
[6]監禁數據集(incarceration data sets)指人口統計、犯罪信息、監獄系統等相關數據。這裏表示他們利用數據集來測試和驗證算法的公平性,以確保算法在處理敏感社會數據時不會產生偏見。
本文經授權譯自FirstPrinciples, In conversation: Jesse Thaler on AI and physics
原文地址:https://www.firstprinciples.org/article/in-conversation-jesse-thaler
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權説明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯繫後台。