張雲泉:下一代中國E級超算計劃2020年完成,將採用國產芯片-張雲泉、科工力量
【本文轉自微信公眾號“科工力量”(ID:guanchacaijing)】
日前,國際TOP500組織發佈新一期全球超級計算機500強榜單。中國超算“神威·太湖之光”與“天河二號”連續第三次佔據榜單前兩位,美國超算“泰坦”則被瑞士的“代恩特峯”擠到第四。這是20年來美國首次跌出前三名。
美國能源部近日宣佈,將在未來3年撥給6家科技公司總額2.58億美元的資金,以加速下一代超級計算機技術的研製,目標是到2021年交付至少一台每秒可進行百億億次計算的超級計算機系統。科工力量就此專訪了中國計算機學會高性能計算專業委員會秘書長、國家超算濟南中心主任張雲泉,解讀美國為何跌出TOP500前三,以及中美超算未來的發展。
科工力量**:這次瑞士的“代恩特峯”超越美國的“泰坦”,美國超算跌出TOP500前三,對於這件事您怎麼看?到底是美國超算技術逐漸跟不上時代了,還是另有原因?**
張雲泉**:**這應該是一個大的週期吧,中國超算發展最好的時期,正好恰逢美國超算發展的低谷,這兩個疊加在一塊。顯得中國很強,美國很弱。這是中國超算這幾年發展較快的一個延續,中國最好的機器剛好在這個時間段。美國的機器佈局太晚了,打了一個時間差。這也是國際超算發展經常出現的現象。
另外,美國在明年下半年會強力反彈,會拿出180P的機器,超越太湖之光。而中國將來要超越美國的這台機器,也要一個週期。

代恩特峯
科工力量**:美國有諸多科技公司的技術很強,比如Intel、IBM、英偉達、AMD等,到底是什麼原因導致美國的超算落後了?**
張雲泉**:**美國超算技術依然非常強,也有能力研發更強的超算,只不過美國研製計劃落後,使得中國可以打一個時間差,後來居上。從美國的計劃來看,在明年下半年公佈的下一代超算會採用很多新技術。比如全閃存技術、最新Power處理器、三維存儲、克雷公司動態超算結構等等。美國下一代180P超算上會有很多中國超算上沒有的技術。
科工力量**:“代恩特峯”在芯片上採用了Intel的Xeon E5-2690v3和英偉達的NVIDIA Tesla P100 ,加上美國克雷公司在其中扮演了關鍵作用,有觀點認為,“代恩特峯”其實是名為瑞士打造,但實為美國技術的超算。對這種觀點您怎麼看?**
張雲泉**:**這個確實是美國為瑞士打造的。主要是因為歐洲的超算研製能力比較弱,一直用美國和日本的超算。除了法國稍微獨立一些,能夠研製自己的超算。由於歐洲市場很大,中國超算公司會打進歐洲,聯想、浪潮、華為、曙光現在都在做這個事情,已經簽了不少合同,將來可以看到歐洲用中國的超算做應用。
科工力量**:歐洲超算製造能力相對一般,但超算應用能力卻着實不弱,而中國近年來在超算製造能力上取得長足的進步,但在應用方面,雖然也有應用取得了戈登貝爾獎,但總體而言,和中國的超算製造能力相比,還是遜色一籌。這其中的原因何在?**
張雲泉**:**歐洲超算的應用水平是比較強的,總體來説,中國超算應用水平還是比歐洲稍遜一籌。歐洲的商業化應用特別強,原因在於歐洲的超算製造能力弱,主要精力放在怎麼把買來的超算儘可能用好。而且一直以來重視商業模式,超算都是很多大公司聯合購買,因為公司花錢買了超算,有動力去充分挖掘超算潛能,把超算用好。
這方面對於中國也是有借鑑意義的。
科工力量**:一直有網絡輿論聲稱,美國不製造100P超算是因為美國夠用就好,而中國為了奪第一,所以製造高性能超算。您對這種説法怎麼看?**
張雲泉**:**從歷史上看,美國也一直追求性能,在有一段時間,美國和日本超算爭霸,日本的地球模擬器曾經連續5次拿了冠軍。美國就緊急撥款投資建設了藍色基因。因此美國也是一直追求性能的,並不是説夠用就好。
科工力量**:美國的這一計劃是不是駁斥了網絡上一些人説的“因為現有的超算性能夠用,所以美國不需要比拼超算”?**
張雲泉**:**超算的性能是永遠不夠用的,學科需求、計算的精度和規模是無止境地向前發展,我們現在超算的性能是無法滿足使用的。往往是超算應用降低精度要求、規模要求來配套現在超算的性能。

國家計算流體力學實驗室基於“神威·太湖之光”超級計算機,對“天宮一號”飛行器兩艙簡化外形隕落飛行繞流狀態大規模並行模擬
其實美國一直想把第一搶回去。奧巴馬在下台前就發過總統令,只不過因為當時發總統令的時候快下台了,作用有限,本來3個月就應該做好的事情,結果1年才做完。川普雖然砍了很多科研經費和醫療方面的錢,但他沒砍超算的錢,反而給超算增加錢。
這其實也可以看出超算的重要性。
科工力量**:美國政府資助國際商用機器公司、超威半導體公司、克雷公司、惠普公司、英特爾公司和英偉達公司開發下一代1000P超算,而且美國在下一代超級計算機技術方面的研發總投資將達到至少4.3億美元。**對於美國1000P超算的發展,您怎麼看?
張雲泉**:**超算是國家工程,計算機技術發展的龍頭,需要的資金投入非常高。之前已經介紹了,超算非常重要,所以會有政府高額投資。很多技術都是現在超算裏做出來,然後再民用化。而且超算研發回報也很高,投入一美元,可以獲得十幾美元,只不過回報週期會長一些,而且風險比較高。
科工力量**:從媒體報道看,美國政府承擔了1000P超算的60%研發成本,國際商用機器公司、超威半導體公司、克雷公司、惠普公司、英特爾公司和英偉達公司大約承擔40%的項目經費。為何超算項目如此依賴政府資金投入?**
張雲泉**:**超算的發展一定要政府投入,體現國家綜合國力,僅僅靠公司創新去做,公司的動力不大,因為公司不會考慮國家戰略需求。而且超算研發風險很大,一旦失敗損失很大,這對於公司和股東都是非常不利的。所以世界各國超算都是政府主導,政府牽頭,委託公司來做。美國的做法是政府投入60%,公司也投入一部分。而中國現在還是以政府投入為主,怎麼把公司的財力用起來,這個其實也是中國可以借鑑的。
科工力量**:神威太湖之光采用了申威26010芯片,下一代中國1000P超算還會採用國內單位自主研發的芯片麼?**
張雲泉**:**三台1000P超算原型機用的都是自主芯片。神威會用申威,曙光會用海光,天河會用飛騰。

一名研發工程師展示“神威太湖之光”所使用的“申威26010”眾核處理器
科工力量**:中國計劃在2020年左右建成1000P超算,美國也計劃在2021年建成1000P超算,日本也有這方面的規劃,對於中美日1000P超算競賽,您怎麼看?**
張雲泉**:**現在中美日歐競爭都是白熱化的。現在來看中國的規劃最早,在2020年前後,日本、歐洲、美國都在往後推。日本已經推遲到2021年,歐洲推遲到2022年,美國推遲的更遠到2023-2025年。
但是美國部署了2條線,一條是成熟路線,用相對成熟的技術研發1000P超算,並保證商業應用。另一條是非常激進的1000P超算路線,不考慮任何商業目的和應用,任何能用的技術都用上去,爭取在2021年搶第一。
我估計中國的1000P超算也可能會延期,因為功耗的要求太苛刻了。當然也不排除中國能按照計劃在2020年建成1000P超算。

本文由“科工力量”內容團隊製作,未經授權,不得轉載,否則將追究法律責任。