首台平方公里陣列區域中心原型機,瞭解一下
人類史上最大天文裝置——平方公里陣列(SKA)射電望遠鏡預計2020年啓動建設。作為創始成員國之一,中國除了參與研發這個超級望遠鏡的反射面天線,也在為建設區域中心積極開展準備工作。
據科學網11月20日消息,近日,我國科學家成功研製世界首台平方公里陣列(SKA)區域中心原型機。
“沒有SKA區域中心,就無法開展真正意義上的SKA科學研究。”中科院上海天文台研究員安濤告訴《中國科學報》,此項研究不僅有助於我國科學家在關鍵科學項目中優先獲得數據從而把握創新突破的先機,而且能極大促進國內超算和大數據相關領域自主創新能力。
相關成果發表於《自然—天文》。

中國SKA區域中心原型機 圖片來源:《自然—天文》
分擔總枱數據處理壓力
宇宙從何而來,將向何處去?SKA的建設和運行將為這些問題的解決打開一個窗口。
不同於“中國天眼”FAST,SKA是由一系列小單元天線編織成的巨大網絡,也稱綜合孔徑射電望遠鏡。它不僅能直接成像,還得到海量的數據,這些數據需要射電天文學家運用專門的軟件處理,將數據轉化為科學成果,從數據中“看見”宇宙。
然而,SKA產生的數據量極其龐大,台址國數據處理中心的承受能力無法滿足SKA完整的數據處理和存儲需求,建設多個區域性科學與數據中心成為了必然選擇。
“SKA的兩組望遠鏡陣列分別位於南非和澳大利亞,而另外的大多數成員國也希望有些數據能儲存在北半球,方便科學用户。”安濤補充道。
不過,區域中心不僅僅需要分擔SKA天文台的數據處理的總體壓力,更重要的是,它們要承擔本地區的用户支持,使得SKA科學成果最大化。
原來,各個國家和地區的科研水平和關注的學術領域不盡相同,不同的科學任務要求的計算架構和軟件環境也是各異。台址國超算設備的設計一旦固化,就缺乏靈活性,只有區域中心才有能力充分考慮用户的差異化需求。
建造區域中心原型機
這樣的區域中心技術要求和建設成本相當高,因此需要關鍵設備等的預研,原型機的建造就是其中一項重要的預研內容。
目前,中國雖然有“天河二號”、“神威·太湖之光”等超算設備,但計算能力難以滿足SKA的龐大而複雜的數據處理要求。為了方便數據的國際共享,中心區域必須方便國際同行訪問提取,實現寬帶低延遲國際互聯。這些無疑都對原型機的研製增加了難度。
安濤介紹,成功研製的中國SKA區域中心原型機,整體設計充分考慮了各方面需求,整個系統採用“軟硬件協同設計”的思想,即根據應用程序的特徵,選擇合適的硬件和軟件組件,以實現在有限的功耗下的最佳性能。
此次研製的原型機在計算、存儲、網絡三大模塊中均有創新突破。計算模塊採用新型數據島架構,由執行框架將整個數據中心按照任務需求分成若干個小區域、或多個子數據中心,既可以獨立執行數據處理任務,也可以根據需求靈活重組資源,滿足SKA多任務並行處理的要求。
此外,中國SKA區域中心原型機還首次採用了華為鯤鵬處理器,基準測試表明該服務器整體性能優良。
不過,在處理SKA先導望遠鏡的實測數據中,原型機會遇到實際的問題,有些可能是事先無法預測的,這為未來建設完整意義的中國SKA區域中心提供了寶貴經驗。安濤介紹,原型機還有一個任務是測試軟件和算法,研究這些軟件在大型集羣上的擴展性。“比如我們和國際合作團隊在美國SUMMIT(世界上最快的超算)上開展大規模實驗之前,就在原型機上做了大量測試。”
他指出,針對不同科學用户和不同科學需求,定製不同的計算和存儲設備的組合,使得區域中心能夠發揮最大效率,經濟運行成本也需考慮在內。
區域中心並非單純超算
事實上,中國並非一早就介入了SKA區域中心原型機的研究,世界上有很多國家很早就開始了SKA科學數據處理器的研究工作。但受各國現實條件等的影響,最終上海天文台成功研製了中國SKA區域中心原型機,成為世界上首台SKA區域中心原型機。
在中科院上海天文台研究員洪曉瑜看來,這主要得益於我國領先的超算能力和日益增長的綜合科技實力,其為建設中國SKA區域中心的數據處理平台奠定了重要基礎。
區域中心就是簡單意義上的超算嗎?答案是否定的。相比於傳統的服務於通用型需求的國家超算,中國SKA區域中心對系統架構、業務目標、技術挑戰都提出了更高的挑戰。
首先表現在SKA區域中心是以數據處理為中心而非以計算為中心,SKA數據的運算和管理主要是以數據驅動的工作流模式,巨大的數據流對輸入輸出(I/O)帶寬、單服務器存儲容量與存儲介質的性能均提出了極致需求,而這些都不是國家超算的主流業務類型。
其次,計算平台是專門設計的異構系統。與傳統國家超算強調節點同構以支持大規模作業運行或提供通用計算服務不同,SKA區域中心需要支持眾多不同科學目標的科學工作組,其軟件特徵差異巨大,不適宜用同構的、通用服務型超算中心進行承載。
洪曉瑜告訴《中國科學報》,中國SKA區域中心是國際SKA區域中心體系的一個關鍵節點,不僅承擔第一層級數據(每年百PB量級)的接收、運算、管理和存檔,而且需要與其他區域中心進行數據交換和協同工作,它還依賴於科學軟件的研發和科學用户的長期服務支撐,這些都不是通用型國家超算可以比擬的。
總體而言,區域中心除了承擔計算和存儲的國際義務,更重要的是要承擔研發SKA數據處理軟件、培養中國SKA第一梯隊科研人才的重任。
“中國SKA區域中心一旦建成,這意味着中國科學家不出國門,就能便捷使用數據產出科學成果,並吸引國際夥伴來中國進行科學研究和交流。”安濤表示,下一步團隊將逐步向國內外用户開放,支持天文學家使用原型機分析處理SKA先導望遠鏡數據。