“天河三號”後,神威E級超算原型機在濟南正式部署啓用
【文/觀察者網 尹哲】緊接着“天河三號”而來的,是神威E級超算。
“E級超算”(Exascale)是指百億億次超級計算機,被公認為“超算界下一頂皇冠”。據新華社報道,5日,神威E級超算原型機在國家超級計算濟南中心完成部署,並正式啓用。這距離“天河三號”E級原型機在國家超級計算天津中心通過項目課題驗收剛剛過去兩週。
觀察者網注意到,出於投入巨大、分攤風險的考慮,我國E級計算機研製計劃第一期主要為“關鍵技術”研究,並安排了三個E級原型樣機的研製。第二期將具體研製E級計算機。
除“天河三號”、神威E級之外,中國三大“超算軍團”裏還有中科曙光。
從披露的進度看,前兩台均計劃在2020年完成研製部署,將先於美日等國跨越百億億次量級台階。


8月5日,在國家超級計算濟南中心,工作人員在查看神威E級原型系統運轉情況。新華社記者 郭緒雷 攝
“能夠上路的概念車”
新華社報道稱,神威E級超算原型機由國家並行計算機工程技術研究中心聯合國家超級計算濟南中心等團隊,經過兩年多的關鍵技術攻關與突破,最終成功研製並部署投用。
該原型機硬件、軟件和應用三大系統中,處理器、網絡芯片組、存儲和管理系統等核心器件全部為國產化。
其中,系統軟件由完全自主研發的神威睿思操作系****統、神威睿智編譯器等構建;運算系統全部採用**“神威26010+”眾核處理器**,高速互連網絡系統全部採用申威網絡交換芯片、申威消息處理芯片,這些關鍵部件均具備完全自主知識產權;存儲和管理系統由申威多核處理器構建,實現對該領域產品的國產化替代。

8月5日,在國家超級計算濟南中心,工作人員在巡視存儲設備運轉情況。新華社記者 郭緒雷 攝
“神威E級超算原型機,就好比是一台能夠上路的概念車。”山東省計算中心(國家超級計算濟南中心)主任楊美紅表示,原型機的成功研製,對E級計算機研製方案和技術路線進行了全面系統驗證,為E級計算機的研製成功鋪平了道路。
另外,《齊魯晚報》引述國家超級計算濟南中心副主任潘景山的話説,神威E級計算機預計於2020年完成研製部署,將率先跨越百億億次量級台階。

8月5日,在國家超級計算濟南中心,工作人員在查看存儲設備運轉情況。新華社記者 郭緒雷 攝
國家超級計算濟南中心已部署有“神威·藍光”超算系統。
作為我國首台全部採用國產CPU和系統軟件構建的千萬億次計算機,“神威·藍光”已運行7年。
數據上,神威E級超算原型機的運算能力已達到“神威·藍光”的三倍,體積僅為後者的九分之一,能耗同比下降75%。
截至目前,神威E級超算原型機已完成包括全球氣候變化、海洋數值模擬、生物醫藥仿真、大數據處理和類腦智能等12個領域的35項重大計算任務,未來應用前景非常廣闊。
打破美方禁運
“天河”系列超算一直由國防科技大學(下稱:國防科大)牽頭研製。
觀察者網此前報道,運算速度預計可達“天河二號”10倍以上的“天河三號E級原型機系統”已在國家超級計算天津中心完成研製部署,並於7月22日順利通過項目課題驗收,將逐步進入開放應用階段。

這是7月26日拍攝的“天河三號”E級原型機全貌。新華社記者 毛振華 攝
“天河三號”超算原型機首次亮相於今年5月16-18日舉行的第二屆世界智能大會。
根據澎湃新聞當時的報道,該系統採用自主的飛騰處理器、天河高速互聯通信和麒麟操作系統,實現了芯片的全國產化,告別了前代的英特爾芯片。
而之所以替代英特爾芯片能夠在當時引起轟動,是因為在2015年4月9日,美國商務部宣佈對包括國防科大和國家超級計算天津中心等在內的4家中國超算機構禁運Intel****至強Xeon處理器和Xeon Phi加速器。
(觀察者網注:另兩家為國家超級計算長沙中心,國家超級計算廣州中心。)
正如前文所描述的那樣,這項禁運目前已經被打破。
7月26日,《科技日報》引述該項目相關負責人的話稱,“天河”系列超算已經全面掌握五大自主核心技術,即具有自主知識產權的四大芯片和自主操作系統,所有核心技術和產品均****不再被國外“卡脖子”。
據他介紹,這四大芯片分別為通用CPU、加速器CPU、互連通信路由芯片和互連接口芯片,並且已經裝配在“天河二號”2期系統中。
基於此,“天河三號”超算將對這四大芯片進行全面升級。
該負責人進一步指出,“天河三號E級原型機系統”還實現了四大自主創新,即三款芯片——“邁創”眾核處理器(Matrix-2000+)、互連接口芯片、路由器芯片;四類計算、存儲和服務結點,10餘種PCB****電路板;新型的計算處理、高速互連、並行存儲、服務處理、監控診斷、基礎架構等硬件分系統;系統操作、並行開發、應用支撐和綜合管理等軟件分系統。
因此,該原型機關鍵技術的突破和系統研製,將“全面為‘天河三號’整機系統提出了計算、訪存、通信性能平衡的****設計方案。”
上述負責人補充道:“未來‘天河三號’E級超算將對已經設計生產的三款計算、互聯通信核心芯片再進行全面升級,同時基於飛騰CPU****設計新的多核CPU,實現可支持海量數據存儲的層次式存儲系統,對適用高性能計算和高效大數據處理的柔性體系結構進一步優化。”
在上述原型系統的基礎上,“天河三號”超算有望於2020年研製成功,其運算能力將比“天河一號”提高200倍,存儲容量提高100倍。
低調的曙光
與“天河”與“神威”的你追我趕相比,中科曙光屬於較為低調一員。
除了在2016年7月4日宣佈正式啓動由其牽頭的E級高性能計算機原型系統研製項目外,中科曙光一直以來並未披露很多關於E級超算的研製進展。
項目啓動當天,該企業介紹了超融合自適應並行處理體系結構(HCAPP)和全浸沒式相變液冷技術(整台超算浸沒在冷卻液中),但是其採用的CPU和加速器等內容寥寥。
《環球時報》7月27日報道認為,曙光E級可能會採用中科院體系內研發的CPU和加速器(比如龍芯系列),其最終部署時間也將會在2020年以後。
同日,微信公眾號“新智元”則透露:“曙光E級原型機將於近期完成項目驗收,預計在8-9月,所有三台原型機都將完成最終驗收。”

對於曙光E級超算的架構,觀察者網專欄作者鐵流給出了自己的推斷。
他指出,曙光E級原型機是基於“自主X86架構,考慮到海光和曙光的關係,基本上CPU將採用前者的X86 CPU,也就是AMD Zen的國產化版本”。
觀察者網也梳理發現,第一財經今年3月報道稱:“成都海光高端通用服務器芯片項目,總投資12.9億美元,開展國產通用服務器CPU芯片設計與產業化,2017年新增投資國產化先進GPU項目、‘先進微處理器技術國家工程實驗室’項目和國家核高基‘超級計算機處理器研製’專項,與成都聯手打造國產化高性能計算芯片的技術和產業中心。”
對此,鐵流分析道:“在2017年,國內單位引進了AMD的GPU技術,而且相關報道里和超算項目聯繫在一起,那麼曙光超算的方案極有可能是CPU+GPU,而且是AMD CPU國產化版本+GPU國產化版本。”
美砸超百億追趕,日2021年部署
説完中國的,我們自然更關心海外,尤其是美日等國E級超算的發展情況。

美國E級計算項目(Exascale Computing Project,ECP)網站截圖,下同
今年4月9日,美國能源部長裏克·佩裏(Rick Perry)宣佈了一項關於超級計算機研製的徵詢方案(RFP),將可能投入最多18億美元(約合人民幣123億元),在2021-2023年開發至少2台部署於美國能源部國家實驗室的E級超算。
此舉的目的,是“鞏固美國在E級計算時代的領導地位”。
該方案下發展的新超算系統,將成為去年6月佩裏授權開發的美國首台E級超算——“極光(Aurora)”的後續系統。
新聞稿提到,“極光”正在美國阿貢國家實驗室(Argonne National Laboratory,ANL)研製,計劃於2021年上線。
徵詢方案將參考屆時的需求,評估在2022-2023年對“極光”升級,以及發展後續系統的可能性。

該方案(RFP)是被稱為“珊瑚(CORAL)”的三個美國國家實驗室——“橡樹嶺(Oak Ridge National Laboratory)”、“阿貢(Argonne National Laboratory)”、“利弗莫爾(Lawrence Livermore National Laboratory)”合作的產物。
他們認為,這筆“投資”可以支持至少兩種超算架構的研發,平均成本在4-6億美元。除此之外,還能可能產生第3種系統架構,或與前兩種相似,或不同。
該計劃的具體金額將由國會定奪。
至於日本,據“TOP500”的報道,2016年,富士通和日本理化學研究所(RIKEN)承諾為該國開發首台E級超算——“後京”(Post-K),並計劃在2020年部署。
然而,在宣佈計劃幾個月後,該項目負責人石川裕(Yutaka Ishikawa)博士承認,“後京”的部署可能會延遲兩年。

圖源:社交網絡
不過,在今年6月,富士通宣佈已完成“後京”計算芯片原型研製並開始測試。
對此,“TOP500”指出,根據其進展,日本已經走在了2021年部署E級超算的軌道上。
本文系觀察者網獨家稿件,未經授權,不得轉載。