算效最高的智算中心上線,天府智算為AI產業帶來哪些啓示?_風聞
大数据在线-昨天 16:53
四川簡陽,地處川中、控扼巴峽,自古乃成渝、川鄂之間的交通重鎮,素有“天府雄州”之美譽。
步入數字經濟時代,“天府雄州”得天獨厚的地理位置再次彰顯出巨大的戰略價值。簡陽市成為成渝算力樞紐的天府數據中心集羣關鍵佈局點,對今後支撐四川數字經濟和成都AI產業高質量發展有着舉足輕重的意義。
近日,位於簡陽市的天府智算西南智算中心正式上線,標誌着成渝算力樞紐完成階段性建設。同時,天府智算西南智算中心一躍成為當前國內算力效率(MFU)最高的算力中心,不僅代表着智算中心未來建設方向,也為AI產業高質量發展注入新動能。
AI產業高質量發展離不開算效比
四川被譽為“天府之國”,擁有完備的產業體系和深厚的教育資源。2023年,四川的經濟總量已經躍居全國第五。從過去向經濟要體量,到現在體量與質量並舉,四川已明確發展新質生產力和經濟高質量發展的核心思路:即加快做優做強人工智能產業,利用AI等數字化技術全方位、深層次賦能傳統產業。
以成都市為例,成都市近年來集聚起一批人工智能企業、科研機構和創新平台,初步形成基礎層、技術層、應用層全產業鏈覆蓋的發展格局。最新《成都市人工智能產業高質量發展三年行動計劃(2024—2026年)》更提出,到2026年,成都人工智能核心產業規模達到1700億元,帶動相關產業規模達到1萬億元,建成全國人工智能產業發展高地。
可以預見,隨着四川經濟全面向高質量發展轉型,以及人工智能產業的持續發展,未來將產生大量且持續的算力需求,高質量的AI算力更是不能缺位。能投天府雲執行董事兼總經理任國斌直言,與四川地區經濟體量和AI產業發展需求相比,數據中心等算力基礎設施正處於一個追平補短的快速發展階段。
能投天府雲執行董事兼總經理 任國斌
此時,建設高水平的智算中心就成為大勢所趨。除了智算中心規模之外,算力效率(MFU)的重要性也日趨突出,以平衡未來算力與需求之間的供需關係。事實上,天府智算西南智算中心的上線,無疑是成渝算力樞紐在高水平智算中心的一次成功實踐。
眾所周知,人工智能產業高質量的發展,離不開生成式AI應用的爆發與普及。而生成式AI則需要基於海量的自然語言或多模態數據集,對擁有巨大參數的AI大模型進行持續訓練,往往需要千卡甚至萬卡的AI集羣來支撐,所需AI算力當量遠勝過往應用。
因此,超大規模的AI集羣的訓練算力效率(MFU)將直接影響到模型訓練時長、成本乃至效果,更對於生成式AI研發創新、AI產業高質量發展有着潛移默化般的影響。毫無疑問,天府智算西南算力中心為算力效率(MFU)的提升打了個樣兒。
據悉,天府智算西南算力中心為提升算力效率(MFU),與浪潮信息AI團隊緊密配合,對算力系統進行專業設計,對集羣架構、高速互聯、算力調度等方面全面優化,並結合浪潮信息源大模型的訓練優化經驗,對分佈式訓練策略進行針對性優化,通過合理設計張量並行、流水並行和數據並行,精準調整模型結構和訓練過程的超參數,最終實現千億參數規模AI大模型的訓練算力效率(MFU)提升至80%,刷新業界AI大模型訓練算力效率(MFU)新高。
除了在算力效率(MFU)方面出類拔萃之外,天府智算西南算力中心還在數據中心能效層面進行了大膽創新和突破,以42kW智算風冷算力倉為創新切入點,完美解決數據中心高密部署、高效散熱和機房維護改造等一系列挑戰。
智算風冷算力倉:迎接高密化趨勢
高密化是所有智算中心未來發展的確定性趨勢。
由於人工智能產業的快速發展,對於數據中心算力、散熱、運維乃至建設模式都提出全新要求,使得數據中心不可避免的走向高密化。高密化對於數據中心有着兩個關鍵性影響:其一、可以大規模部署高密機櫃,實現單位面積算力產能的提升;其二、會直接推動數據中心能效比提升以及先進節能技術落地,以滿足數據中心綠色低碳的要求。
以四川地區為例,大量的AI服務器在智算中心部署,使得單機櫃功率與功耗不斷攀升,數據中心需要解決固定空間內高密化部署的高效散熱挑戰;其次,四川省已經頒佈數據中心PUE政策,集羣起步區內新建數據中心PUE不高於1.25,傳統數據中心節能技術不能滿足需求;第三,數據中心的建設模式與機房等環境需要匹配智算中心和未來算力服務的建設需求。
為此,能投天府雲與浪潮信息進行聯合創新,成功研發出42kW智算風冷算力倉,並且在天府智算西南算力中心得到大規模部署。浪潮信息服務器產品線總經理趙帥介紹,“42kW智算風冷算力倉本質上就是超高密化的模塊化數據中心。”
42kW智算風冷算力倉以AI算力為核心,是為AI服務器量身定製的支持高算力密度部署的新一代智算基礎設施,集計算/存儲/網絡於一體,高效融合機櫃、配電、UPS、空調、監控、消防等系統,基於標準化、去工程化、運行效率最優化、管理智能化等原則設計,具備快速交付-省時、高密部署-省地、高效節能-省電、安全智能-省心等核心優勢。
當下,以天府智算西南算力中心為代表的智算中心,普遍需要快速應對人工智能產業對於算力的急迫需求。通過42kW智算風冷算力倉,數據中心只需預留場地、冷量和電力,一週即可完成部署,建設週期縮短70%。
42kW智算風冷算力倉的高密化部署將單機櫃功率密度從3~7kW大幅提升到42kW,輸出超高密度算力,實現單位面積算力產能的突破,減少建設用地60%。
難能可貴的是,42kW智算風冷算力倉通過風冷模式即實現了高效節能,融合中壓到末端饋線的全功率簡鏈路供電及高效UPS系統讓電能損耗有效降低30%以上;冷熱通道全密封+列間空調高温進水模式讓製冷能效比提升10%以上,大幅降低PUE,相比傳統風冷數據中心整體節能25%以上。
此外,42kW智算風冷算力倉還充分融合了AI能力,利用AI管理平台實現數據中心統一納管,結合AI智能調優算法,實現數據中心級及服務器級雙向故障預警,做到數據中心真正的AI化監控、管理、運維,安全可靠性提升30%。
“現在的智算中心,單純依靠AI服務器已經遠遠不夠,需要通過高水平的數據中心來綜合支撐AI服務器的部署與應用。在天府智算西南算力中心,浪潮信息與能投天府雲很好地分析了業務需求,在一期採用了42kW智算風冷算力倉解決方案,快速上線滿足了當前AI產業的算力需求。”趙帥補充道。
為“智算中心”建設打個樣兒
IDC《全球人工智能支出指南報告》預測,到2027年,中國AI投資規模有望達到381億美元,在政策扶持和產業轉型升級的驅動下,以智算中心為代表的先進基礎設施在未來五年將成為市場投資的重要方向。
隨着各地對於經濟高質量和新質生產力發展的需求,建設高水平的智算中心將是未來整個社會、產業的共同目標。而天府智算西南智算中心從規劃、設計到上線,無疑為智算中心未來的建設打了個樣兒。
首先,天府智算西南算力中心做到規劃先進、貼近需求,針對成都市AI產業高質量發展的算力需求,從先進的規劃設計到快速上線,實現了規劃與需求的高度契合。目前,天府智算西南算力中心已經為高校研究所、科技型企業提供算力服務,廣泛支撐起大數據、深度學習、智能語音語義、生物醫學等領域的需求。
其次,天府智算西南算力中心是產業合作與創新的典型。智算中心是數據中心在AI時代的一次重塑,涉及到算力、環境、建設模式等方方面面。浪潮信息與能投天府雲緊密合作,共同打造出創新的42kW智算風冷算力倉解決方案,將AI大模型訓練算效比提升到80%。
第三,未來有望對外輸出、惠及產業。面對未來AI產業高質量發展的需求,42kW智算風冷算力倉解決方案不僅為天府智算西南算力中心帶來實質性的突破,更有望為其他智算中心建設帶來最佳借鑑方案和巨大的產業價值。
“42kW智算風冷算力倉在天府智算西南算力中心交付之後,實現了數據中心定製服務領域的重大突破,為四川人工智能產業發展提供強勁的動能。”趙帥最後表示道。