中國超算發展除了面臨美國挑戰外,還經常被這個問題困擾_風聞
李晓鹏-中兴大城首席经济学家-经济学博士2018-06-23 14:52
近日,美國新一代超級計算機Summit問世,在被中國佔據榜首五年之後,美國超算重回世界第一寶座。Summit的峯值計算能力可以達到每秒20億億次,比中國最快的超算“威·太湖之光”還要快115%。新聞爆出後,立刻在國內引起了廣泛的關注,有關超算技術和超算產業發展等話題的討論再次被點燃。

一、中美超算爭霸的歷史回顧
回顧中美超算交鋒的歷史,在2010年之前,美國公司曾經長期稱霸世界超算競技場,美國的“藍色基因”超級計算機曾連續5年獨霸世界第一的寶座。直到2010年下半年,中國的“天河一號”在中國超級計算升級中心升級完成,成為中國首台排名第一的超級計算機,這才打破了美國在超算領域的長期霸主地位。
但是,到了2011年,日本的K-computer超越了天河一號成為世界第一,而且成為人類歷史上第一次突破每秒1億億次計算能力的超級計算機。2012年,美國的超級計算機Titan(泰坦)再次幫助美國奪回世界第一的寶座。
2013年,中國的天河二號以每秒3.4億億次的速度再次登頂超級計算機榜首。此後一直佔據第一名的位置達3年之久,美國人苦於一直無法做出超越天河二號的超算,就開始動起了歪腦筋,在2016年,當時的奧巴馬政府宣佈禁止Intel公司向中國出口用於超級計算機的頂級芯片,希望以此遏制中國超級計算機的發展勢頭。這一招果然“立竿見影”,第二年,天河二號就被擠下了超算世界第一的寶座,取代它的是採用了中國自主研發芯片“申威26010”眾核處理器的“神威-太湖之光”,計算能力相比天河二號提高了幾乎200%,達到了9.3億億次每秒。
由於中國超算長期位居世界第一,國內一些對歐美髮達國家存在某種過度崇拜心態的人對此難以接受,拋出了所謂的“超算無用論”,認為片面追求運算速度對一個國家科技能力的提升並無用處,不過是形象工程。但這一次,美國發布的Summit超算把“神威-太湖之光”的記錄又提高了一倍多,達到了20億億次每秒,正説明超算研發始終是大國科技競爭的戰略重點,也打破了國內某些關於“超算第一無用論”的傳言。超級計算機是“國之重器”,在石油勘探、工程模擬、環境監測、核工業等方面應用廣泛,是支撐一個國家基礎科學研究的核心武器之一。
對於美國這次的勝利反超,中國方面完全無需感到任何的沮喪,這種頂級計算能力的競爭對中國、美國乃至全人類都是喜聞樂見的良性競爭,中美輪流登頂是一件好事。而且,中國在超算方面的研發也並未停步,目前基於新處理技術的世界首台100億億次的超級計算機天河三號也正在研製過程中,預計到今年年底,天河三號的技術驗證即可開始運行,但估計還要再過2~3年才能達到100億億次的運算能級。但中國在這方面的研究是走在世界前列的,因此在未來兩三年內重新奪回第一超算的王座是比較有把握的。
二、中國超級計算機的研發佈局與產業應用
從長遠來看,中美在超級計算領域的爭霸可能會持續很長的時間,輪流登頂在未來數十年都可能會是一種常態,中國要在這場戰略競爭中取得優勢,必須從研發和產業應用兩個方面同時着手。超級計算機的發展,一方面有賴於國家戰略性投入支持,另一方面也有賴於市場需求應用的拉動。必須廣泛培育超級計算機的各種應用場景,創造更多面向科技產業進步的實際需求,才能為超級計算機的研製提供不竭動力,形成國家戰略研發與科技成果市場化落地的良性互動。
(一)中國超級計算機的核心研發機構佈局
目前來看,我國超級計算機的研發機構主要有四個,其中三個在北京,一個在長沙,在長沙的是國防科技大學計算機研究所,主要從事計算機系統結構、高可信系統結構、工程工藝、操作系統、編譯系統及應用軟件的研究與開發。該研究所也是我國最早從事超級計算機研發的機構,早在1983年就推出了我國第一台每秒運行1億次以上的巨型計算機“銀河1號”,也讓中國成為繼美國和日本之後又一個能夠獨立設計和製造巨型計算機的國家。此後,兩次問鼎世界超算冠軍的天河一號、天河二號以及未來的天河三號也都是該研究所研製的。

北京的3個機構分別是國家並行計算機工程技術中心、中科院計算技術研究所、聯想數據中心集團。其中,2016年登頂世界第一的“神威-太湖之光”即由國家並行計算機工程技術中心研製。中科院計算機技術研究所的超算品牌為曙光系列,聯想數據中心集團的超算品牌為深騰系列。
(二)中國超級計算機的主要生產製造佈局
中國超級計算機的生產製造濟南、天津、北京三足鼎立,位於濟南的浪潮集團是我國超算集羣系統份額第一的廠商,為哈工大設計了異構分佈式的高性能計算系統,用於航天科技的研究;為青島海洋科學與技術國家實驗室提供了我國海洋領域規模最大,性能最強的超算系統;協助清華大學建設地球系統模擬器;為南方科技大學建設了整體計算能力超過300萬億次的超算系統。天河二號計算機的主架、機架和機櫃也均由浪潮集團製造。
位於天津的曙光計算機天津產業基地是亞洲最大的超級計算機生產基地,基地年產能可達50萬台PC服務器和2000套HPC。
位於北京的聯想數據中心集團則在企業的超算系統市場居於全國領先地位,在全球高性能計算機TOP500的榜單中,聯想研製的高性能計算機的數量已連續四次位居中國第一、全球第二(全球第一為惠普),並以17%的增長率成為全球增速最快的HPC廠商,目前全球500強企業超算系統中,有92家採用了聯想的HPC。
從研發超算的廠商來看,美國企業佔據優勢,不過中國企業也表現出色。美國惠普以123台上榜系統位居第一,中國聯想以81台繼續佔據第二;中國浪潮從半年前的20台增至56台,從上一期的第六名躍居第三名;美國克雷以53台排第四名,中國中科曙光以51台排第五名,IBM和華為各以19台同列第六名。
(三)中國國家級超算中心佈局
這些國家級中心主要是指中國重要的超算的實際部署地,截至2007年,中國共建成了6座超算中心,包括無錫中心(神威-太湖之光)、天津中心(天河一號)、濟南中心、深圳中心、長沙中心、廣州中心(天河二號),其中天津中心在超級計算機的產業化運營方面走在全國前列,依託國防科技大學和中科曙光,建設天河科技園,以泰達服務外包產業園為依託,規劃建築面積150萬平方米,借重“天河”品牌優勢,在國家超算中心已有客户資源基礎上,着力打造創業創新平台以及科技成果轉化基地。目前,包括騰訊、惠普、華勝天成、獵聘等在內的科技、金融等領域入住企業達到80家。無錫中心也正在加快推動超算技術的產業化步伐,以“神威·太湖之光”為“圓心”,探索建設“超算產業園”。此前,國家超算無錫中心建設“神威社區”,集聚應用者、研究者共同營造提升自主體系下的超算應用生態。而產業園的探索,將推動超算產業鏈的打造,推動超算與優勢產業的結合,形成更強的超算“產業能量”。另外四大中心目前主要還是以對外提供超算服務和相關的科技研發為主。
(四)中國超算技術的主要產業應用
超算技術的應用領域十分廣泛,除了軍工領域外,還在基礎科學研究、新材料研發、大氣海洋環境模擬、生物醫藥篩選、工程仿真、石油勘探、人工智能、智慧城市、圖像渲染等方面有非常重要的應用。
1. 基礎科學研究。在基礎科學研究領域,超級計算機可以提供基礎科學研究領域中的各類數值模擬服務以及作業腳本,設置若干可能影響計算性能的參數,完成相關計算模擬任務。目前,廣州中心重點發展地球物理、天文學方面的應用,包括行星與大氣模擬、中微子對宇宙大尺度結構演化的影響模擬、百萬核量級地震模擬。由北京師範大學天文系教授張同傑領銜的宇宙中微子數值模擬團隊,在“天河二號”超級計算機系統上成功完成了3萬億粒子數的宇宙中微子和暗物質數值模擬,揭示了宇宙大爆炸1600萬年之後至今約137億年的漫長演化進程。有專家指出,這一研究成果為通過天文觀測手段研究宇宙中微子及其質量打開了一扇新的大門,有望大大縮短人類探索宇宙起源與演化奧秘的時間進程,對基礎科學、宇宙環境、地球生態、礦藏勘探等領域的科學研究將起到積極的推動作用。長沙中心則重點研究固體物理、基礎化學,典型案例包括溶液中結晶與形貌控制研究、負微分電阻效應的原理計算。天津中心重點研究凝聚態物理、計算機化學,典型案例如1/4玻色子佔據的團簇莫特絕緣體的量子電動力學研究。

2. 新材料研發。計算材料學是近年裏飛速發展的一門新興交叉學科。它綜合了凝聚態物理、材料物理學、理論化學、材料力學和工程力學、計算機算法等多個相關學科。其目的是利用高性能計算機,模擬材料的各種物理化學性質,深入理解材料從微觀到宏觀多個尺度的各類現象與特徵,並對於材料的結構和物性進行預測,從而達到設計新材料的目的。目前,天津中心利用天河一號提供了材料科學方向的計算機模擬服務,通過在新材料計算平台上部署豐富的科學計算軟件,為用户提供從原子水平出發,從微觀跨越介觀和宏觀尺度,模擬材料研究中的各類問題和現象,並幫助用户實現通過計算來設計新材料的目的。典型案例如調控表面原子結構製備優異電催化劑、水的量子效應。廣州中心重點研究新能源設計利用、新材料研發製備,典型成果如風電全生命週期資產管理、納米硬度測量。濟南中心主要研究模擬分析材料的理論性能,典型成果如非過渡金屬雜質材料改性、非過渡金屬缺陷對絕緣體材料改性。
3. 大氣海洋環境模擬。從海洋環流數值模擬到空氣質量實時監測,到海洋災害預報等,高性能計算正在以強大計算力助力人類實現對環境生態的深入洞察,實現海洋環境數值預報的精確性,為我國海洋資源開發以及海洋環境保護提供技術保障。目前,廣州中心主要對地區性乃至全球的風資源、洋流資源、太陽能等資源進行預測評估,典型案例如珠江口-南海區域海洋數字化系統、中國海區域大氣海洋耦合模式、城市空氣污染溯源研究。濟南中心重點關注海洋與氣候變化應用、氣象應用,典型案例如海氣耦合模式、南中國海內孤立波預報系統。天津中心主要進行天氣預報與霧霾預警,國家超級計算天津中心聯合中國氣象局氣象科學研究院、國家氣象局衞星數據中心、清華大學、南開大學等單位,共同開展空氣質量實時預警預報(霧霾)研究工作,在中國氣象局新一代天氣模式GRAPES的框架下,在線耦合大氣化學模塊CUACE/Chem,構建自動化實時霧霾預警預報測試平台,支持高分辨率霧-霾數值預報系統的建立,為我國和區域尺度霧-霾數值預報系統提供支撐。目前已實現預報系統的自動化運行,目前可進行全國15km精度霧霾數值預報和若干地區3~9km精度霧霾數值預報,可實時對外提供未來72小時關於PM2.5、PM10、SO2、CO、NO2、O3、AQI等參數的預報。
4. 生物醫藥篩選。超級計算機在探究基因奧秘、蛋白質結構、生物信息以及藥物設計等方面已經成為不可或缺的工具。例如通過超計算機對生物大分子進行深入研究,從原子水平上來掌握生物大分子的三維結構和生物功能之間的關係,並在此基礎上進行藥物設計,是國內外生物醫藥研究的重要方向之一。與此同時,利用超級計算機進行高通量虛擬藥物篩選在藥物研發中的作用顯得日益重要,也已成為國際上藥物研發不可或缺的重要組成部分。在基因組學研究中,高通量測序是最重要的數據來源。然而,高通量測序技術的飛速發展,使得基因組學研究的數據急劇增長,急需超級計算機進行處理和分析。目前,廣州中心主要研究藥物篩選、基因組測序、精準醫療,典型成果如高通量短序列比對、藥物虛擬篩選軟件、心臟亞細胞鈣離子動力學模擬。無錫中心重在評估藥物效用,研究生物大分子動力學,典型案例如惡性腫瘤酶與藥物原子水平、禽流感病毒通道構想變化。濟南中心重點發展分子動力學模擬,如外切纖維素酶催化結構。長沙中心重點發展基因工程、藥物篩選。重點案例有兩項,一是基於受體的藥物虛擬篩選。使用分子對接技術,針對與埃博拉病毒蛋白VP35的對接,採用160萬CPU和MIC核協同計算,一天完成4000萬分子化合物的抗埃博拉病毒藥物篩選,是國際上目前最快的已知化合物篩選,為應對爆發性惡性傳染病的應急藥物快速研發提供了強大的計算模擬保障。二是構建我國最大、世界領先的生物醫藥信息處理平台,為我國自主藥物研發提供技術支撐。重點支持靶向HIV-1蛋白酶抗艾滋病藥物設計與基於IgG-Protein A 複合物結構的棉衣藥物研究工作,開展了高達1024個CPU規模的HIV-1蛋白酶和免疫球蛋白IgG的分子動力學模擬優化,實現了每天10萬種以上化合物的高通量虛擬篩選。
5. 工程仿真。工程仿真是通過數字圖像建立工程系統模型並利用所建數字圖像模型對實際工程系統進行實驗研究的過程。利用模型復現實際系統中發生的本質過程,並通過對系統模型的實驗來研究存在的或設計中的系統,又稱模擬。利用超算進行工程模擬,能夠大幅縮短企業的產品研發週期,降低研發成本,提供生產效益。目前,天津中心主要依託國家超級計算天津中心開展工程仿真設計,典型案例有整車氣動性結構優化、汽車電池動力系統仿真等。廣州中心依託國家超算廣州中心進行工程仿真計算,利用“天河二號”強大的計算能力,使工程師能在幾分鐘或幾小時內仿真和測試數千種設計方案,並通過遠程可視化平台實時查看設計效果和修改設計方案。並以雲服務的方式提供CAE計算和HPC訪問,支持產品設計的全工作流。此外,廣州中信還部署了一系列主流的商業軟件ANSYS(Fluent、CFX、Mechanical),LS-DYNA,Abaqus,HYPERWORKS,FEKO,覆蓋了多個學科多個領域的資源需求。自運行以來,廣州超算中心協助中國商飛、廣船、廣汽等一批企業單位完成了諸如機翼選型、船舶減阻、汽車碰撞、器件結構優化等仿真計算,大幅縮短企業的產品研發週期,降低研發成本,提供生產效益。深圳中心依託國家超算廣州中心進行工程仿真計算,如中興手機跌落模型。長沙中心依託國家超算長沙中心進行工程仿真設計,如汽車車身結構快速優化設計。
6. 人工智能。人工智能是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能的發展需要依靠三大支柱:強大計算能力、龐大的數據集合、不斷演進和優化的模型算法。超級計算機則是人工智能這三大支柱最為堅實、可靠的供給源泉。目前,無錫中心集中研發人工智能機器人,如無人駕駛機器人、智能電話機器人。廣州中心重點發展人工智能醫療,如眼科中心人工智能機器人。長沙中心也聚焦於人工智能醫療,通過打造醫療信息平台、智能診斷系統等,結合大數據、高性能計算和人工智能三大關鍵技術,結合循證醫學和經驗醫學兩大模型,將人工智能技術應用於醫療行業,核心算法融合一系列人工智能算法,白天輔助醫生看病,晚上把最新的病例和手冊等數據傳輸回超算中心進行機器學習,在學習中診斷,在診斷中學習,顯著提高臨牀疾病的診斷效率和精度。其開發的人工智能醫生CDSS是一個結合了“大數據+超級計算+人工智能”技術的臨牀輔助診斷決策系統。目前整套系統部署在國家超級計算長沙中心的“天河”超級計算機上,並於2016-17年在上海華山醫院的呼吸內科、西安西京醫院的精神科、301醫院、中山醫科大學附屬醫院等已有測試應用,取得了很好的實際效果。

7. 智慧城市。智慧城市是以多應用、多行業、複雜系統組成的綜合體,支撐這個綜合體的安全運行需要考慮基於雲計算的網絡架構。超級計算機的計算能力和海量存儲能力能夠深度挖掘數據,盤活存量數據,推動大數據與智能信息的融合。目前,廣州重點建設多種類型雲計算平台,如依託天河二號搭建的互聯網智能銷售系統、廣東省省級教育數據中心。深圳中心主要搭建雲計算服務平台,為政務、教育提供支撐。深圳科技創新委與市育局簽訂了聯合創建深圳教育雲框架協議,目的是為深圳所有市民打造一個一站式終身教育平台。超算中心除了提供服務器、雲存儲等IAAS底層基礎設施外,還提供鵬雲公共PAAS及學習空間、OA、學籍管理等SAAS模塊建設。2013年9月1日,已經進行了教育雲首期應用--網絡學習空間的發佈。截止目前,已經在深圳47所小學、初中、高中進行試點啓動。長沙中心致力於搭建智慧城市各類雲平台,如長沙市政排水管網雲平台。天津主要搭建行業雲平台,如濱海新區地鐵Z4線BIM雲。
8. 圖形渲染。圖像渲染是用軟件將3D模型生成圖像的過程。3D模型是用嚴格定義的語言或者數據結構對於三維物體的描述,它包括幾何、視點、紋理以及照明信息。超算中心的渲染服務主要是針對高畫質、高畫幅的渲染情形。目前,天津中心主要構建天河動漫與影視特渲染平台,解決複雜場景渲染,典型項目包括生物危機遊戲渲染、春晚舞台渲染、建築漫遊動畫。無錫中心攜手藍海創意雲、浪潮集團打造國家超算文創支撐平台,搭建了基於“神威·太湖之光”的超大規模集羣渲染公共服務平台,為國內外文創產業提供超大規模雲渲染服務。其中藍海創意雲負責超大規模雲渲染服務的運營工作。藍海創意雲渲染農場建立在藍海彤翔自主研發Golden Farm集羣渲染系統軟件基礎之上,融合了雲計算、並行存儲等前沿技術,支持3ds Max、Maya、Houdini等各種主流製作軟件,以及V-Ray、Redshift、Iray、Octane等渲染器,由高水準渲染工程師提供7*24小時技術服務支持,為動漫影視、建築表現、CG藝術等全領域提供專業的雲渲染解決方案。深圳中心主要與計算機3D渲染軟件結合,如V-Ray渲染插件、3ds Max 處理圖像、Maya三維動畫等。
(五)中國超算能力過剩了嗎?
關於中國超級計算機的利用率是否過剩,一直以來是一個頗具爭議的話題,認為超算“算能過剩”的主要依據是2015年天河二號所在的超算廣州中心主任袁學峯的一段話,在一次採訪中,他表示天河二號的利用率基本穩定在40%左右,還有60%在等着別人用。但到2017年廣州超算中心的超算利用率已經達到了84.5%,用户總數持續增加,經過近4年的發展,已經部署了700多個應用軟件和工具軟件,用户總數突破2000家,成為全世界用户數量最多、利用率最高的超級計算系統之一。從這個發展歷程來看,所謂超算產能不足其實是一個發展中的暫時性地問題,頂級超算研製作為一個國家的戰略性基礎工程,必須和機場、高鐵等重大基礎設施一樣,堅持適度超前的發展原則。如果出現超算剛剛投入使用就滿負荷運行的情況,反而説明超算的研製出現了嚴重的滯後。天河二號是在2014年6月底才正式面向普通用户開放申請,一年後使用率達到40%,3年後使用率達到85%,現在基本滿負荷運轉,是一個非常合理的發展路徑,目前中國第一、世界第二的神威-太湖之光利用率也已經達到了65%,相比天河二號同期的利用率也有很大的提高。
表1 國內超級計算中心利用率
總的來看,國內的六大超級計算中心資源利用率平均在75%以上,其中,廣州、天津、深圳超過了80%,相比之下,國外超算中心的利用率普遍在60%左右。天津超算中心的中國首台千萬億次超級計算機“天河一號”每天在線任務量已超1400個,處於飽和運行狀態,這是歐美國家級超算中心都很難達到的一個業務規模。
國內超算中心在項目承接方面也處於國際頂尖水準,其承擔的項目多為國家級、省級科研課題,能夠充分發揮超級計算機的性能。以廣州超算中心為例,已累計為國內外419家用户提供計算服務,支撐國家級課題超過100項,廣東省及廣州市課題超過30項,百萬核以上應用9個,十萬核以上應用20多個。目前,中國頂級超算的研製應該説不存在能力過剩的問題,相反,還潛在着資源短缺的問題,加大更高運算能力的超算研製力度是當然之舉、必然之舉。
三、“應用難”是當前中國超算發展存在的主要問題
當前,中國超算在研製方面居於世界領先地位。如前所述,雖然美國的Summit暫時取得了世界第一的位置,但在100億億超算研發方面中國實際上是居於領先地位的,再次反超的可能性很大。2017年全球超級計算機500強中,中國的超算數量達到202台,數量是世界第一位。中國超算發展面臨的主要問題並不在於頂級超算研製領域,而在於中高端企業超算的系統規模和超算的企業應用方面。
國內企業級超算應用嚴重缺失,美國超算企業級規模發達程度遠超中國,美國較大的汽車、石油企業有10個大型超算系統,除此之外還有一堆小的超算機器,在中國汽車產業,超算主要用來算部件,而美國算的是整車。如果拿中美同等規模的公司做對比,美國公司的超算系統規模是中國公司的10倍多。
目前,超算推動超算技術的市場化應用面臨着四大難點:
1. 問題程序化難——科研人員難以將專業知識轉化成超級計算機能夠識別的語言。將專業知識轉換成計算機能夠識別的語言,超出了很多科研人員的業務範圍,他們只能通過自學計算機編程或藉助於計算機專業同行的支持,完成手頭的項目。然而計算機編程對於專業的科研並無多大幫助。比如,對生物領域的研究者來説,將基因測序和蛋白質摺疊轉化成計算機代碼和應用指令難度就很大。
2. 數據快捷傳輸難——對於各個學科來説,需要超算分析和處理的應用模型都是很大的量級,這也意味着如果應用人員通過網絡上傳到超算中心的話,需要漫長的時間。類似大氣物理、地質勘探等數據,都是以TB級的標準來衡量的,數據傳輸對於應用人員來説不僅僅需要耗費漫長的時間,而且從超級計算機獲取數據也需要網絡的下載支持。
3. 全程自動自行處理難——超算數據自行處理能力差。由於平台的特殊性和應用的針對性,僅憑用户個人很難對所有的程序進行有效的監管,在出現錯誤的時候也很難第一時間獲得報警。畢竟老師們還有很多工作去做,一動不動的盯在屏幕前檢測系統狀態並不現實。
4. 數據應用難——超算數據應用水平低。超級計算機數據的應用是超算應用的終極目標,項目結束後需要提供對應的數據報告,對項目的結果進行分析,這是用户非常關心的事情。如果依靠人力,依然是非常漫長而繁瑣的工作。
四、優化中國超級計算機產業應用的發展建議
(一)培養編程人才,普及超算編程知識,提升編程轉化能力
超算應用相關的人才缺乏是目前超算產業發展的主要短板,應從服務提供和應用能力兩個方面進行相關培訓培養,提高超算市場應用能力。
1.要提高超算中心的市場服務能力
研發方便編程的軟件,建立專業的超算編程團隊,對用户提供技術支持,幫助用户將專業知識轉換成計算機能夠識別的語言。
2.開展超算編程培訓。
超算中心以及有超算需求的科研機構可以開展超算課程培訓,提升從事科研人員的編程轉化能力。如中山大學、清華大學等聯合超算中心創建的超算學習平台。並嘗試將超算課程引入高校,開設講座或選修課。在高校開設講座或選修課,讓學生對超算能夠整體認識,瞭解超算在各行各業的作用。在大量使用超算的天氣預報、物理、化學等專業課中少量穿插超算介紹,使用學生能在需要的時候迅速找到努力的方向。
(二)提高應用軟件轉化超級計算機計算性能的水平
1. 鼓勵更多企業及科研機構開發程序優化工具。
超算要想良好運行,需要成熟的超算通用軟件,要對原有的程序進行針對性的優化。中國缺乏在軟件領域有代表性的企業或科研機構,軟件缺乏,超算的能力就無法施展。美國英特爾公司在產學研三端都在推行其代碼現代化工作,以便不同類型的用户都能獲得超算軟件和編程方面的技術支持。並專門針對英特爾MIC架構高性能計算系統推出了《MIC高性能計算編程指南》工具書。
2. 成立國家級超級計算並行應用軟件行業中心。
成立國家應用軟件行業工程中心,能夠有效的發揮超級計算機的計算能力,提高程序並行水平,同時提升應用軟件的開發。並行中心應以重大專項為牽引,集中多學科人才和資源,穩定研發方向和人才隊伍。
3. 建立開放式軟件程序社區。
建立包含企業以及科研機構的軟件程序開發社區,搭建超級計算機開發人員與用户之間的橋樑,讓計算機開發人員能夠更好的理解項目,有助於更好的發揮計算機的性能,用户也能對軟件運行能否需要優化提出建議。
(三)減少超級計算機數據的網絡傳輸時間
1. 架設專線網絡,提升網絡傳輸速度。
專線網絡,能夠優化用户到超算間的網絡路徑,提升數據傳輸的速度。如北京並行科技有限公司在北京與廣州之間架設並行專線網絡,優化用户到超算間的網絡鏈路,並支持電信、聯通、教育網等網絡運營商。用户可以隨時自動匹配或手動選擇鏈路,找到最適合自己的、延遲最低的選擇。
2. 搭建遠程可視化平台。
通過遠程可視化操作,減少數據傳輸的時間,用户可以在物理桌面中運行的應用程序,都能在虛擬桌面中運行。遠程可視化平台也實時獲得結果的反饋,方便對計算模型進行調整。上海超級計算中利用NVIDI公司的 GRID 技術,將圖形加速能力帶到企業在物理桌面上運行的程序,以滿足每個用户的特定需求。
(四)提高超級計算機數據自行處理數據水平
超算數據管理專業平台能夠幫助用户進行海量數據自動化管理,用户可以實時查看作業運行情況、診斷應用性能問題和帳單彙總報告等多重功能。因此,想要高超級計算機數據自行處理數據水平,就需要鼓勵企業開發超算數據管理專業平台。如並行科技Paramon是並行科技針對超算管理專業平台,可以提供桌面端和手機端的全方位支持。此外,曙光推出了一款名為EasyOP服務平台,EasyOP採用互聯網+的模式,實現7×24小時對高性能計算機程序的運行監控。用户不僅可以隨時瞭解作業的運營情況和故障,還可通過網頁或微信等在線諮詢服務與線上專家進行一對一的交流。EasyOP擁有五大關鍵技術——監控數據實時遠程採集、海量數據存儲與展示、故障的分析與定位技術、大量數據統計與分析、移動終端的集成與推送。
(五)提高超級計算機數據應用水平
1. 開發性能更好、存儲能力更強數據庫軟件。
好的數據庫軟件能將數據以一定方式儲存在一起,能為多個用户共享,具有儘可能小的冗餘度,建立與應用程序彼此獨立的數據集合,具有整體性、共享性的優點。由於目前超算處理的數據越來越龐大,存儲容量也是數據庫很重要的參考指標。
2. 建立超級計算機數據分級、分類處理框架。
目前應用超級計算機處理的項目的數據量都比較大,想要實現處理數據高效、可靠、 簡潔的需求,必須建立數據處理框架,對數據分類、分級處理。如 Google 公司設計的 Map Reduce 框架由 Map 與 Reduce 組成,以實現“分而治之”。換言之,就是將獲取的數據源分成幾個部分,每個部分則對應不同的初始Key/Value(鍵值)對, 並將其交由不同的 Map 任務區進行處理。
(六)促進超級計算機在企業領域的應用
1. 提供高性能計算力的雲服務平台。
對企業而言,獲取高性能計算能力一般有兩種形式。一是自建超算集羣,二是租用超算中心的計算資源。前者存在超算集羣建設週期慢、價格貴、初始投資高、機型不能及時更新等問題;而後者也面臨着超算中心資源難尋、計算資源迭代週期長、大規模伸縮靈活性欠佳等一系列問題。因此,以雲服務的形式提供高性能計算力是促進超級計算機在企業領域的應用,解決企業困境的關鍵。雲服務平台還具有快速可獲取、資源靈活配置、硬件高性能等優點。
2. 滿足多樣化高性能計算場景需求
具有競爭力的平台應該能滿足多樣化的高性能計算場景需求,在工業製造(CAD/CAE、碰撞、材料模擬等)、生物基因和人工智能等場景都擁有相應的平台和行業應用集成,讓客户在使用高性能計算服務時專注產品研發和創新,無需關注底層集羣和調度系統,提升產品研發效率和上市速度。
3. 打造開放的超算雲生態
在高性能計算領域,超算企業並不能滿足於做一個單獨的解決方案,更應該用開放的理念來建設超算雲生態,需要從應用層針對性地匹配解決方案,才能讓場景更好落地讓高性能計算力更好地服務於各行各業的密集型計算需求。
【作者簡介:李曉鵬,國研智庫產業經濟研究院院長;謝劍波,國研智庫產業經濟研究院主任研究員】
【參考文獻】
1. 白瑞雪. 中國超級計算機的超級任務[J]. 瞭望.2013.
2. 劉雲飛. NUMECA CFD高性能集羣解決方案[J]. 計算機輔助工程.2012
3. 鄧斐. 與天河零距離 參觀國家超級計算天津中心[J]. 微型計算機.2011.
4. 張國雙. 國家超級計算天津中心舉行聯合實驗室簽署儀式[J]. 現代化工.2016
5. 劉豔. 生物醫藥信息諮詢的項目管理[J]. 現代情報.2004
6. 楊黎燕. 澱粉微球在生物醫藥領域應用[J]. 糧食與油脂.2011
7. 宋飛. 超級計算中心供電系統探討[J]. 計算機工程與科學.2013
8. 呂成軍. 過程級工業軟件平台設計與實現[J]. 冶金自動化.2016
9. 周奇智. 用於車輛開發研究的駕駛模擬系統的設計[J]. 都市家教:下半月.2013
10. 劉堂春. “天河二號”蟬聯最快超級計算機[M].中學政史地:初中適用. 2014
11. 王世豪. 廣州建設國際科技合作交流中心功能定位分析[J]. 廣東科技.2012
12. 子思. 解鈴還須繫鈴人[J]. 中國農資.2012.
13. 劉行. 成都市發佈雲計算產品及解決方案[J]. 通信與信息技術.2012.