曙光副總裁聶華:E級超算要來了,E級應用還遠嗎
日前,中科曙光在其舉辦的“2016曙光技術創新大會”上宣佈,正式啓動由其牽頭的E級高性能計算機(簡稱“E級超算”)原型系統研製項目。曙光公司副總裁沙超羣透露,按照預期目標,在該預研項目結題時,中科曙光將研製出能效比10GFlops/W以上、保證可擴展至10萬節點、PUE低至一定水平的E級超級計算機的原型系統。
那麼,E級高性能計算機相對於“神威太湖之光”強在哪裏?是否會採用國產芯片和操作系統?究竟何時能建成呢,帶着這些疑問,觀察者網專訪曙光副總裁聶華為網友們答疑解惑。
**觀察者網:**E級超算原型系統和最後的E級超算差別在哪裏?
**聶華:**簡單地説,原型系統在速度、規模等方面和最終的E級超算存在差距。研製原型系統的目的,是對一些關鍵技術難點進行測試和改進,為最後建造全部的系統掃清障礙,避免出現大的技術錯誤和難題。在攻堅E級超算課題的路徑上,曙光的計劃是:
·完成E級原型機系統;
·驗證E級機研製的關鍵技術和路線圖;
·形成E級機的完整方案;
·為國產E級超算的研製奠定技術基礎。
**觀察者網:**E級超級計算機的運行速度比“神威太湖之光”快多少?
聶華: E級超算是指每秒可進行百億億次數學運算的超級計算機。剛剛榮膺TOP500榜首的神威·太湖之光,運算速度達到93PFlops,接近每秒十億億次,峯值速度則突破了十億億次,那麼E級超級計算機,則要求運算速度在此基礎上提高至少一個數量級,即10倍以上。考慮到當前超算已經發展達到的水平,未來或將面臨一定技術瓶頸,因而實現這一躍升並不簡單。

觀察者網:“神威太湖之光”把最快計算機的持續計算速度刷新到93PFlops,有輿論説超算已經性能過剩了,這種説法對麼?
**聶華:**判斷超算性能是否“過剩”,需要辯證地分析。
從絕對意義上講,人類追求速度是永無止境的。這就像人類文明的發展,相對於廣袤的未知空間,人類的智慧是非常有限的。隨着不斷深入地認識世界,人們越來越深刻地體會到這一點。在探求前沿領域、解決複雜問題方面,我們永遠需要更加強大的計算工具,也就是超級計算機。所以,在這個意義上,從來不存在速度和性能過剩的問題。
與此同時,出現這種聲音,也提示我們在操作層面,出現了一些問題。也就是説,在應用領域,我們的應用和課題設計沒有和硬件發展取得同步,稍顯滯後。對於我國,在超算應用層面方興未艾,與歷經幾十年發展積累的發達國家還存在一定差距,而我國的超級計算機硬件發展速度飛快,所以這方面的問題就更加凸顯。
有了這樣的認識,未來我們全社會應該更加重視應用開發,讓領先世界的中國超算更好地為國家發展服務。
需要強調的是,曙光作為一家企業,完全遵循市場化運作,靠市場生存。因而推動超算市場化、商業化關係到企業的生存根本,因此應用更是曙光關注的焦點。近年來,曙光着力發展超算的應用,推動超算在市場中的應用,尤其是在雲計算、大數據領域的應用,取得了顯著成績。
**觀察者網:**發展E級超級計算機的意義何在?
**聶華:**用技術發展的眼光來看待,超級計算機從誕生之日到今天,其所發揮的重要所用不斷突現。也就是説,隨着超算性能的不斷飛躍,隨着人類社會、文化、科技等不斷發展,我們不斷欣喜地發現,超級計算機的應用領域在不斷擴展,從最初侷限於前沿科技到今天滲透進你我的生活。隨着神威·太湖之光將人類超算速度刷新到接近100P,下一步實現E級超算,也就是1000P,已成為各國重要的戰略課題。從這個意義上來説,早日實現E級超算,也標誌着人類技術水平一個里程碑意義的跨越。作為地球村重要成員的中國,有能力、有義務、也有抱負,來率先實現這一目標。
以國家戰略的眼光來審視,超級計算機是一個國家技術水平和綜合國力的體現。發展E級超算,爭取率先摘得這個王冠上的璀璨明珠,不但能夠激勵我國超算事業更快發展,還能帶動與之密切相關的其它領域更快發展。與此同時,事關國家榮譽,它也將進一步提升全國人民對國家的信心,增強國人自信,推動國家進步。
曙光作為商用高性能計算機的領導廠商,不斷致力於推動應用市場化。雲計算、大數據時代的到來,為超級計算機打開了一片新的市場,很多E級應用都需要用E級超算來解決,在這方面,曙光已經在地球模擬、地球觀測、環境預測三個領域,做了有益嘗試。
案例方面,我們有兩個潛在的E級應用:
一個是曙光與中科院電子所合作,聯合投資成立了航天星圖。航天星圖是立志於做全球領先的空天數據系統和服務,專門處理衞星數據,種類多樣的衞星產生的數據量非常大,一顆大的衞星一天的數據量就是上百個T,這些數據如何處理,從而為宏觀決策、國計民生能發揮作用?這就是合資公司航天星圖展開的E級應用開發。
另外,曙光與中科院大氣所成立了中科三清,針對日益引起關注的霧霾問題,建立一套面向生態大數據平台的科技治霾的E級應用,包括霧霾成因更加精準地分析,以及為治霾提供決策支持。我們希望中科三清通過曙光的超級計算機跟環境數據的結合,能夠打造一個天藍、地綠、水清的世界。在這一過程中,模式、數據、超級計算機成為科技治霾的完整方案的組成部分,缺一不可。
按照公司領導的部署,未來曙光每年要爭取開發兩個重大應用領域,積累十年就可以為E級計算機找到20個重大應用,在氣候、生態環境、航天、乃至癌症、犯罪等等領域,發揮高性能計算機的巨大價值,讓E級超算真正用起來。
**觀察者網:**曙光6000曾經採用過龍芯,加上曙光和計算所的關係,E級超級計算機會採用計算所研製的眾核芯片麼?
**聶華:**提到芯片,我相信未來也是百家爭鳴、百花齊放的狀態。曙光在實施E級超算研發的過程中,國產芯片毫無疑問是首要考慮的方案。
由於目前處於預研階段,對於關鍵問題尚未有定論,我們會基於原型系統的研發,綜合評估,確立最佳方案並及時公佈。
**觀察者網:**曙光的E級超級計算機能像“神威太湖之光”那樣實現芯片、互聯網絡、操作系統等核心技術全部自主研發麼?
**聶華:**如果簡單問能不能,那麼國人已經實現了的,我們的回答是一定能!而且,曙光也熱切期盼我們國家在芯片、網絡和操作系統,乃至應用領域都領先世界,成為實現E級超算的首選。
中國超算的起步,正是受制於發達國家的禁運,讓我們認識到自主創新的主要性,曙光對此有着深刻的體會和認識。在這個意義上,神威·太湖之光再一次證明了中國在超算領域有能力在自主創新中取得領先,也給某些秉持保守落後的技術發展思維的發達國家上了一課。

一名研發工程師展示“神威太湖之光”所使用的“申威26010”眾核處理器
然而回過頭來,我們冷靜客觀地審視這個問題,盲目強調絕對的自創也不是我們應有的態度。歸根結底,超級計算機代表的是全人類的技術進步。面對全人類共同的技術課題,開放包容、合作共贏的思路,一定程度上會幫助我們更加高質量、高效率、低成本地解決問題。
目前,曙光的E級超算剛剛啓動,未來一切皆有可能。我們將綜合考量,選擇最適合的方案。
觀察者網:“神威太湖之光”的性能功耗比是6GFlops/W,E級超級計算機如何做到10GFlops/W?
**聶華:**為應對擴展性的挑戰,我們採用了層次化的設計,即6D-Torus全互聯架構,我們從處理器、加速部件到節點,多個節點形成一個超節點,多個超節點組成一個硅元,由多個硅元形成超級計算機系統,這樣可以進行很好的擴展。在這個網絡裏面,超節點採用IDC方向的互聯,超節點之間採用XYZ方向的互聯。我們採用的彈性的、可成定義的計算部件。這個計算部件採用自主知識產權的處理器和加速部件,可以達到性能功耗比每瓦10GFlops以上。在最近一次德國的超算大會上,全球最綠色的超級計算機6.6GFlops/瓦,也就是通過採用6D-Torus全互聯架構,我們的性能功耗比將會提高一倍。
**觀察者網:**E級超級計算機最大的挑戰和技術難點在哪裏?
**聶華:**實現E級超算,在訪問存儲、穩定性、功耗、擴展性等方面都面臨着巨大的挑戰。從技術角度看,最關鍵的難點在於功耗——如何能夠在達到百億次運算速度前提下,將功耗控制在20MW之內,這是世界各國面臨的難題。
從超算作為一個行業的發展角度來看,E級計算機應用的挑戰是最大的。從5年前,曙光就關注這個問題:這麼大一台機器,幾十億的規模怎麼把它用好、用出水平、用出規模?這是更大的跨越。對於曙光來説,沒有應用,總有一天超級計算機做不下去,因為曙光是企業投入、市場是企業開拓,如果超級計算機技術不能在市場上獲得應有的回報,總有一天超級計算機的市場會萎縮,我們的研發投入和創新就會萎縮。值得欣慰的是,5年來,曙光通過潛心鑽研超級計算機與雲計算、大數據、人工智能的結合點,應該説,我們有了一定的答案。
**觀察者網:**新的E級超級計算機是由中科曙光、國防科技大學和江南所聯合研製?還是三個單位各自為戰,在幾年後建成2-3個E級超級計算機?
**聶華:**應該説這裏面既有競爭又必然包含合作。“十三五”規劃確立三家單位各自牽頭推進E級超算項目,未來會經過評估,確定一兩家來完成,而攻堅階段很可能會產生合作。
需要指出的是,三家單位在產品和市場上各有特色,缺一不可,共同促進中國高性能計算機產業的發展:
江南所最突出的是使用了全國產的CPU,在其它自主技術方面也很好,且在本次top500中獲了第一名;
國防科大在自主高性能互聯網絡方面也非常獨到,在網絡方面擁有很好的技術,採用通用CPU;
曙光是三家機構中唯一完全遵循商業化市場運作的企業,因而更加註重高性能計算機的產品化、市場佔有率。在商業化方面,曙光是做的比較好的。可以發現,目前國內最快的高性能計算機不是曙光的,但曙光連續7年蟬聯中國高性能計算機TOP100排行榜市場份額第一,由此可以看出曙光更加註重市場份額。
**觀察者網:**E級超級計算機原型系統以及E級超計算機預計何時才能夠建成?
**聶華:**根據十三五規劃,國家計劃在2020年實現E級超級計算機的研製。根據目前的進度規劃,目前處於預研階段,兩年後將對這階段成果,主要是原型系統進行評估,之後進入下一階段。
(採訪:鐵流 微信公眾號:tieliu1988)
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。