超級計算機不是用來打遊戲的,而是用來給居民供暖的 | 袁嵐峯_風聞
风云之声-风云之声官方账号-2021-09-21 22:07
導讀
2021年9月19日全國科普日,袁嵐峯應中央廣播電視總枱之邀,在央視頻《奮進吧!科學少年》直播節目中做了一場演講《構建中國的“最強大腦”》,介紹中國科學技術大學的成果“用超級計算機‘神威太湖之光’的一千萬個核心對魔角石墨烯進行離散伽遼金密度泛函理論模擬”,此文為演講稿。這次直播持續12個小時,從9:00到21:00,許多單位的科學工作者為青少年朋友們提供了豐富的科學大餐,以後錄播視頻將在CCTV-10播出。
大家好,我是袁嵐峯,來自中國科學技術大學。今天,我來向大家介紹我們學校的一個工作。

中國科學技術大學校徽
這項工作得到了《新聞聯播》《東方時空》等許多媒體的報道。在今年5月28日的院士大會上,習總書記還提到了它,作為戰略高技術領域取得的新跨越之一。

媒體報道與習總書記講話
這項工作是什麼呢?它叫做:用超級計算機“神威太湖之光”的一千萬個核心對魔角石墨烯進行離散伽遼金密度泛函理論模擬。
大家看明白這一串説的是什麼了嗎?

黑人問號
如果能看明白就怪了,説明你已經是這個領域的超級內行了!我想現場的觀眾裏應該很少有這樣的內行。這是一個非常複雜的工作,不過,要理解這個工作的基本意義,我相信大家都可以。我們來共同努力。
首先,最基礎的要點是:這是一個超級計算機的工作。超級計算機簡稱超算,是科技強國的國之重器。神威太湖之光就是我國目前最強的超算。
實際上,許多人可能早就聽説過超算,但並不知道它是幹什麼的。最常見的問題大概是:超算用來打遊戲是不是特別快?永遠不會卡?你如果聽到問這種問題的,立刻就知道他對超算一無所知。因為,超算根本不是用來打遊戲的!
許多人之所以會問這樣的問題,是因為一提到計算機他們想到的就是自己家裏的計算機,一台顯示器加一台主機這種。

個人電腦
但超級計算機並不是這個樣子。它佔地面積巨大,甚至能佔好幾層樓。它有很多個機櫃,裏面裝滿了芯片、硬盤和通信器件。還有很多配套系統,如電力系統、冷卻系統、外圍系統、軟件系統、應用系統等等。

神威太湖之光

神威太湖之光運算系統與互連網絡
回頭來看我們工作中的關鍵詞,“一千萬個核心”,一個核心就是一個處理器。想想看,一個計算任務動用了上千萬個處理器,這是多麼龐大的系統!實際上,一台超算的能耗,就頂得上一個中小城市。
你會花這麼高的成本來打遊戲嗎?當然不會。我們平時見到的電腦遊戲,都是一個芯片就能玩的。而超算上執行的任務,都是同時使用很多個芯片,這叫做“並行計算”。所以,超算根本不是用來玩遊戲的。
那麼超算真正的用處是什麼呢?是科學計算。給超算輸入某個問題以及這個問題的參數,比如説解方程組,然後超算就去做大量的數值計算把它解出來,最後把計算結果輸出來。這才是超算乾的事。
這其中最核心的需求,就是算得快。比如説天氣預報,你必須在今天就把明天的天氣算出來。如果你算得不夠快,到後天才能算出明天的天氣,那不就沒用了嗎?

天氣預報
説起天氣預報,大家就會想到今年7月的鄭州大雨(https://mp.weixin.qq.com/s/ehnqD5QJhkk1B-0ti2djLw)。當時許多人問:氣象部門有沒有失職?基本的回答是:沒有失職,因為氣象局在事前準確預報了特大暴雨,發出了預警。

2021年7月19日20時至20日20時全國降水量預報圖
只是在細節層面,例如暴雨中心的位置,預報還有些偏差。這可以反映出人類當前的天氣預報水平:定性的“有沒有”預測得很準確,不過定量的“在哪裏”和“有多強”就不見得很準了。
這有兩方面的原因。一方面是我們對氣象數據的取樣不夠多,也就是説給超算輸入的數據不夠多。比如説我們沒有把整個地球表面全都鋪滿氣象站,因為那樣我們就沒地方住了。另一方面是我們的計算能力不夠強,也就是説我們用這些數據解方程的結果不夠精確。
實際上,計算能力包括硬件和軟件兩方面。我們可以自豪地指出,中國科學家對天氣預報的算法有重大貢獻。每當聽到這個天氣預報的音樂(《漁舟唱晚》,https://music.163.com/#/song?app_version=8.2.55&id=30352477),我們就應該感謝曾慶存院士,他是2019年國家最高科學技術獎獲得者。

曾慶存
在五十年代,他提出瞭解天氣預報方程的“半隱式差分法”。跟半隱式相對的叫做“顯式”和“隱式”,半隱式是其中最好的方法。半隱式差分法至今仍在國際上廣泛使用,曾慶存先生被公認為數值天氣預報的創始人之一。
不久前的今年6月,中國開始試運行一台模擬整個地球的超算(https://www.cas.cn/zkyzs/2021/06/302/cmsm/202106/t20210615_4793121.shtml)。它叫做“寰”,寰宇的寰,英文是EarthLab,地球實驗室(https://www.cas.cn/zkyzs/2021/06/303/cmsm/202106/t20210622_4794212.shtml)。這名字太有範兒了,一聽就知道是模擬地球的。

“寰”計算機硬件平台“硅立方”展示圖

地球模擬實驗室
“寰”這台超算建立了一套地球系統的模型,用來模擬地球的大氣圈、水圈、岩石圈、生物圈等多個圈層。它一天就能算出這些圈層10年的變化,所以可以反推地球的過去,預測地球的未來(《為了給地球“算命”,我們建了這座大科學裝置 | 朱江》)。
那麼模擬地球有什麼用呢?例如大家知道,人類面臨着嚴重的氣候變化問題,極端天氣越來越多。“寰”就可以預測全球的氣候變化。這甚至對我國的外交都很有價值。以前我國對氣候變化的預測能力不足,在國際上談判時話語權就不足,沒法用我國科學家的研究支撐我們的外交訴求。以後,這種狀況就會改變了,我國將成為氣候變化研究的引領者。
除了天氣預報和地球模擬之外,超算的用途還有很多。例如空氣動力學,現在設計飛機和汽車的時候都需要去吹風洞,超算模擬就相當於吹一個數值的風洞。又如宇宙學,我們的宇宙是怎麼變成現在這個樣子的,以後又會變成什麼樣?超算告訴你。還有核武器,美俄英法中五大國都在1996年簽署了《全面禁止核試驗條約》。不能實彈爆炸了,那麼他們現在怎麼研究核武器呢?回答是用超算模擬。所以你看,從民用技術到基礎研究到國家安全,都離不開超算。

神威太湖之光應用領域
2020年,超算還有一個非常有趣的應用:驗證“九章”的結果。大家對九章都有印象吧?它是去年一個非常轟動、全世界刷屏的重大成果,它是一台量子計算機,是科大的潘建偉院士和陸朝陽教授等人做的。
九章是什麼樣子呢?大家在新聞報道中看到的都是像這樣的,瑰麗的光芒產生一種“不明覺厲”的效果。

九章光量子干涉實物圖
但在我看來,九章是這樣的。這是2020年12月5日,團中央請我拍一個宣傳片,介紹科大的量子信息研究。潘建偉研究組的苑震生教授迎接我們參觀實驗室,然後在一個狹窄的空間中,他告訴我們:我們身前這個格子裏就是九章的光路,身後那個格子裏就是九章的核心器件。原來九章是個地理位置!我們就身處在九章之中!我們是在九章裏面向大家介紹九章!

在九章中介紹九章
那麼九章究竟是幹什麼的呢?我簡單地解釋一下:九章是一台光量子計算機。就是説,它是一個光學裝置,這個裝置產生的結果對應某個數學問題的解。這個數學問題叫做“玻色子取樣”,它的具體表達式如下。一眼看不明白沒關係,只要理解這是個有明確表達式的數學問題就好。

玻色子取樣的概率分佈
這個數學問題用現有的計算機算非常困難,因為它的計算量隨光子數增長得非常快。比如説,算20個光子沒問題,算40個光子就很吃力了,算80個光子到太陽毀滅了都算不完。
而用九章這台實驗裝置把結果測出來就快得多,相當於把對這個問題的解加快了很多倍。具體是多少倍呢?回答是一百萬億倍。這是量子計算這個領域到目前為止全世界最大的成果。
神威太湖之光對九章做出了什麼貢獻呢?潘建偉和陸朝陽在運行九章的時候,就請神威太湖之光來做驗證(《太湖之光燒錢了?!關於“九章”量子計算機的7條冷八卦 | 測量一下scientific》)。也就是説,用超算來直接計算那個數學問題,看跟實驗結果是否相同,以此判斷實驗對不對。神威太湖之光出色地完成了這個任務,在光子比較少的時候確認了九章的正確性。
這項研究還有一點意外的好處。超算運行時會發熱,冷卻它需要大量的水。神威太湖之光的負責人表示,驗證“九章”時產生的冷卻水可以給周圍的居民供暖!(《太湖之光燒錢了?!關於“九章”量子計算機的7條冷八卦 | 測量一下scientific》)所以現在如果有人問“超算有什麼用”,你就可以回答他:給居民供暖!

神威太湖之光冷卻系統
神威太湖之光位於無錫,所以祝賀無錫的觀眾朋友們,你們用的供暖水是世界上最有科技含量的!包含了量子計算機和超級計算機這兩個超級高大上的技術!
神威太湖之光在國際上也是非常著名的。有一個專業的超算排行榜叫做TOP500,列出全世界最強的500台超算。這個榜單每半年更新一次,最新的是2021年6月公佈的(https://www.top500.org/lists/top500/2021/06/),其中神威太湖之光排在第四位。

2021年6月TOP500榜單
來看這個榜單裏的技術指標。第一項Cores是核心的數目,神威太湖之光有1064萬9600個核心。回顧一下我們開頭提到的工作,其中一個關鍵詞是“千萬核心”,可見幾乎是把神威太湖之光所有的核心都用上了!在這個意義上,這是人類運行過的規模最大的計算任務之一。第二項Rmax是實測的最高速度。神威太湖之光的Rmax是93014.6 TFlops,即每秒運行9.3億億次浮點運算。TOP500就是根據超算的Rmax來排名的。
再來看這個榜單裏的前三名。目前排第一的是日本的“富嶽”(Fugaku),第二和第三是美國的“頂點”(Summit)和“山脊”(Sierra)。它們的最高浮點運算速度分別是每秒44.2億億次、14.86億億次和9.46億億次。業界正在努力的目標是,把超算的速度提高到每秒100億億次,這叫做E級超算。
神威太湖之光曾經在TOP500上連續四次排名第一,即從2016年6月到2017年11月。後來它被美國的“頂點”超過,然後美國的“頂點”又被日本的“富嶽”超過,成了現在這樣的格局。
過不久中國可能排名會上升,因為神威太湖之光要升級了。它可能還會叫做某某之光,大家可以想想這個某某會是什麼——肯定比太湖大得多。我們現在暫且把它叫做新神威吧。新神威在硬件和軟件上都有巨大的提升,我們團隊就極大地幫助了它在軟件上的提升。
什麼樣的提升呢?這就要説到我國超算的一大問題:重硬件而輕軟件。雖然在硬件指標上達到了很高的高度,但基礎的軟件還有很多沒有做好。例如許多“庫函數”就沒有,導致對許多實際問題的計算速度遠遠達不到理論上限。也就是説,軟件的缺乏限制了硬件潛力的發揮。
我的師弟胡偉博士和高性能計算專家安虹教授等人合作,結合新神威的硬件體系,在新神威上編好了很多老神威沒有的基礎軟件。實際上,他們在新老神威上計算的是同一個課題,即開頭説的:用一千萬個核心對魔角石墨烯進行離散伽遼金密度泛函理論模擬。我們又一次重複這段神秘的術語,大家現在是不是都能背出來了?很好!
兩次工作的區別在於:在老神威上,由於軟件的缺乏,有些步驟空有快速的算法卻不能使用,他們只能用慢速的算法,導致整體的速度被嚴重壓低。而在新神威上,他們終於實現了這些快速的算法,大大提高了整體的速度。所以現在才稱得上發揮出神威的真正力量——面對疾風吧!

面對疾風吧!
瞭解了這麼多背景,那我們算的究竟是什麼呢?這裏的關鍵詞是“魔角石墨烯”。
很多人都知道石墨烯,它就是單層的石墨,即碳原子的六角格子。石墨烯是一種著名的二維材料,有很多神奇的力學、電學、磁學性質。但什麼叫做“魔角石墨烯”呢?

石墨烯
魔角石墨烯就是像這樣的結構。乍一看,你也許會覺得自己眼花了,但其實並沒有。這個體系有上下兩層,它們原本是相同的,但把它們之間稍微轉一個角度,1.1度,就會出現這樣的效果。當然這只是原子模型,實物並不會讓人眼花。這個角度被稱為魔角,是因為理論和實驗發現,在這樣的角度下,這個雙層結構會出現很多奇妙的性質。例如它可能變成超導體,即電阻變成0。

魔角石墨烯
實際上,這就是曹原的成名作。大家是不是都聽説過曹原,那位從科大少年班出去的MIT物理學博士?2018年,他在實驗上發現了魔角石墨烯的超導,並且因此被《Nature》雜誌評為年度十大科學人物之首。

曹原
到目前為止,他已經發表了8篇《Nature》和一篇《Science》。一開始每次曹原發一篇文章媒體就會沸騰一通,現在平靜多了,大概是因為習慣了。

《25歲曹原的第8篇Nature,或為拓撲量子計算打開大門,但仍需進一步驗證》
言歸正傳。我們要在超算上預測魔角石墨烯的性質,最重要的是,這樣的預測不需要任何經驗參數。我們唯一需要的輸入,就是原子的種類、數量和位置。
我們首先問,這個體系中有什麼原子?回答是全都是C原子。然後問,這些C原子有多少個?回答有20萬個。最後問,這20萬個C原子在什麼位置?根據已知的單層石墨烯結構和兩層之間扭轉的角度,我們就能構造出這些位置。然後還需要問什麼?沒了,我們再也不需要外界告訴我們任何信息了。
根據基本的物理學原理,我們就可以列出方程,預測這個體系的各種性質。這個基本的物理學原理叫做“量子力學”,大家在物理或者化學專業的大學階段就會學到量子力學。
這樣的計算叫做“第一性原理計算”,意思是從最基礎的原理出發做計算,不依賴任何經驗參數。神奇的是,第一性原理計算的結果往往和實驗符合得非常好,這是現代科學的一大奇蹟。而在很多情況下,實驗很困難或者根本沒法做,例如超高温超高壓,這時我們就更是隻能依靠計算了。
這對大量的應用有重大意義,例如材料和藥物的研發。神威太湖之光的宣傳片裏提到,上海藥物所用它在兩週內就完成了常規需要10個月的計算,大大加速了白血病、癌症、禽流感等方向的藥物設計進度。

上海藥物所加速藥物設計
我們實驗室的專業叫做“理論與計算化學”,裏面有很大部分就是第一性原理計算。到同學們讀研究生的時候,歡迎加入我們的專業“理論與計算化學”。
第一性原理計算的好處是精度非常高,付出的代價就是計算量非常大。所以傳統能處理的體系,一般都不超過一千個原子。但在新神威的計算中,達到了多少個原子呢?剛才説了,有20萬個,準確地説,是207360個。提升了兩個數量級!這才是我們這個工作核心的成果。
使這成為可能的,有三個層面的進步。第一個是前面説的,超算硬件的進步,從老神威到新神威。第二個是前面説的,超算軟件的進步,胡偉和安虹等人給新神威編好了很多底層的軟件。第三個是前面沒説的,第一性原理計算算法的進步。
仔細看,那串神奇的“離散伽遼金密度泛函理論模擬”,其實就是第一性原理計算的算法。其中的伽遼金是個人(Boris Galerkin,1871 - 1945),他是一位前蘇聯數學家,他提出了一種解微分方程的方法。

鮑里斯·伽遼金
我國的鄂維南院士,是一位著名的應用數學家。近年來,鄂維南等人把伽遼金的方法創造性地用到了第一性原理計算中,發明了一種新的算法。這種算法的精確度跟以前最精確的相當,計算量卻跟以前最快的相當,實現了一種非常巧妙的組合,所以將來肯定會得到廣泛應用。

鄂維南
胡偉等人已經把這個算法編成了一個軟件,叫做DGDFT。這個名字是什麼意思呢?就是“離散伽遼金密度泛函理論”的英文首字母縮寫,discontinuous Galerkin density functional theory。理工科專業人士的命名方式,就是這麼質樸無華!無論如何,這個質樸無華的軟件對整個理論與計算化學的業界都將產生重要影響。
這項工作的主要作者,包括胡偉博士、安虹教授以及我和胡偉的博士導師楊金龍院士。那麼我是幹什麼的?我並沒有參與這項工作的研究,我是專門來向大家傳播這項工作的。

胡偉

安虹

楊金龍
前面講了這麼多超算的內容,其實超算並不是我的專業。後面講的這些理論與計算化學的內容,才是我的專業。大家如果對理論與計算化學有興趣,想了解“離散伽遼金密度泛函理論”,我可以在這兒講上一個學期。
不過即使講一個學期,恐怕也很難解釋清楚“離散伽遼金密度泛函理論”,DGDFT。最大的困難在於,聽眾首先要具有化學專業研究生的水平。所以今天,我們就先講到這兒吧。我期待同學早日成為研究生,早日成為國家的棟樑之才。
最後總結一下,大家都記住了超算是幹什麼的,對吧?超算不是用來打遊戲的,而是用來給居民供暖的,對不對?
今天見到同學們對科學充滿熱情,我也非常高興。正如毛主席的名言:“世界是你們的,也是我們的,但是歸根結底是你們的。”謝謝大家!