專家:高性能計算硬件助力中國科研 軟件不足待填補
作者:心月
【環球網科技報道 記者 心月】日前,聯想數據中心在北京舉辦了一場媒體溝通會,旨在介紹聯想的HPC解決方案是如何滿足中科院對高性能計算力的需求,並助力基因測序科學研究穩步向前的。
所謂HPC(High Performance Computing),是高性能計算機羣的簡稱,指能夠執行一般個人電腦無法處理的大資料量並高速運算的電腦,其基本組成組件與個人電腦的概念無太大差異,但規格與性能則強大許多。這類機羣主要用來解決大規模科學問題的計算和海量數據的處理,在科學研究、氣象預報、計算模擬、軍事研究、CFD/CAE、生物製藥、基因測序、圖像處理等領域都有着廣泛的應用。
中國科學院作為我國在生命科學研究領域的權威科研機構,具有豐富的HPC集羣使用經驗。然而早期的設備故障率高、穩定性較差,計算性能難以滿足中科院的日常科研需求。且原有機房空調設備老化,耗電量較高,無法支持更多新購IT設備的散熱需求,高性能計算系統升級迫在眉睫。聯想作為全球最大的HPC解決方案供應商,已為中科院搭建了國內第二套採用Intel最新產品的HPC平台為科研攻關提供了強大的計算力支持。
“我們的日常工作以計算為主,分析生物大數據,沒有高性能的計算機羣來支撐,整個科研工作就沒有辦法開展。”中科院遺傳發育所教授梁承志表示,他的研究領域主要是基因組學和生物信息學,研究目標主要是解析基因組,把基因組裏的信息解析出來。在他看來,生物科學的發展對技術的依賴性非常高,因此高性能計算對現代生物信息學研究也就十分的重要。
據悉,今年五月份,在國際著名學術刊物《Nature》上,梁承志教授的課題組首次揭示了小麥A基因組序列精細圖譜,實驗過程中就涉及到大量的生物數據計算分析。
“我的團隊的一個重要任務就是構建從基因型到表型的大數據分析平台。我們已經開發完成了一個初級的水稻基因組分析支撐平台。以後隨着數據的增多,對分子設計育種提供的技術支撐力度也會越來越高。” 梁承志教授向記者介紹,生物大數據有着 “三高”的特徵:高複雜性、高不確定性和高維度。這就導致了計算量的複雜,也證實着部署高性能計算機集羣的必要性。“如果沒有高性能集羣的支撐,對海量數據的分析是無法實現的,因為海量的數據對存儲和計算都有很高要求。而聯想HPC的使用,大大提高了我們的數據分析速度和工作效率”,梁承志教授表示。
據悉,這套全新計算集羣是聯想為中科院搭建的第二套以ThinkSystem SD530作為計算節點的HPC項目。此前,聯想攜手中國科學院數學與系統科學研究院打造了高性能計算集羣,擁有408個計算節點,實現遠超客户預期三倍的每秒1081萬億次的運算速度。與此同時,聯想還提供了包括NVIDIA GPU、英特爾Xeon Phi在內的異構計算平台、基於聯想LEAP的大數據分析測試平台、LiCO集羣調度和管理系統,並參與實施了從機房規劃、建設到整機櫃交付的全週期工程,為其提供了一站式HPC解決方案。
聯想數據中心業務集團中國區政府行業銷售總監邰能波表示,聯想DSS高端並行存儲所提供的存儲總容量2PB多,是中科院原有的存儲系統的約3倍容量,核心的DSS高端並行存儲的聚合帶寬可達到10GB/s以上,是中科院原有的存儲系統性能的2倍。此外,整體交付的模塊化機房高效節能,實際PUE約1.5,為中科院節省了大量電費。
此外,聯想還在北京總部EIC搭建有一套576個計算核心的HPC測試集羣,專門用於聯想與中科院遺傳發育所、微生物所等單位的合作研究測試,助力中科院在學科建設、人才培養和科研等方面保持優勢,支持眾多重大科研項目的順利開展。
記者一行參觀了中科院數學院的機房,儘管面積不大,但性能卻足以支撐中科院數學院的所有數據運算。據相關人員介紹,中科院和聯想合建的計算機集羣,16年之間在這裏不斷更換,目前已更新到了現在第四代深騰8810。計算力也從當時的萬億次,提升至千萬億次。
梁承志教授表示,生物數據複雜性的特點使得其對軟件的要求越來越高,目前很多軟件能力比較弱。儘管市場上現在生物信息的軟件比十年前好太多了,但總體來講,生物信息學分成不同的小的領域,每個小的領域的軟件大家都是各做各的,還沒有真正的好的融合,這需要一個過程。
聯想數據中心中國區方案營銷總監李煒則認為,中國企業目前基本上可以補全高性能計算機硬件領域所有空白點。但是在軟件領域國內很多地方是空白。毫無疑問,中國需要世界級的工業軟件公司。