打通“人工智能+”任督二脈，超聚變AI Space有妙招_風聞

大数据在线-1小时前

2024-10-11

數字經濟時代，算力基礎設施乃經濟發展、產業升級和企業轉型的根基所在。

在中國，打造“新質生產力”、推動經濟高質量發展乃全社會共同目標，算力產業加速發展成為必然。一方面，國產AI芯片迅速成長，呈現出百花齊放的狀態，並在部分場景中經受過考驗；另一方面，“百模大戰”的盛況推動了中國大模型技術、產品突飛猛進，“人工智能+”勢在必行，AI算力需求也隨之水漲船高。

因此，如何讓算力、大模型和AI應用之間更好地適配，打通“人工智能+”任督二脈，真正推動人工智能在垂直行業落地和算力產業高質量發展，就成為當前算力產業必須攻克的難題。

值得關注的是，在近期舉辦的2024 中國算力大會上，一系列算力領域成果的頒佈，讓產業界看到巨大希望。

這其中，超聚變AI Space大模型加速引擎就是突出代表。AI Space大模型加速引擎為企業AI業務落地提供端到端的產品和服務，旨在解決當前大模型遷移、訓練、以及推理應用落地過程中的諸多難點，成功入圍本屆算力大會“創新先鋒案例”，獲得產業界的高度認可。

從可用走向好用：AI大模型還缺些什麼

對於中國各大行業的企業而言，“大模型”已然成為打造“新質生產力”和推動“人工智能+”落地的重要抓手。可以預見，來幾年生成式AI等大模型技術在政務、金融、製造、能源等行業的滲透率會明顯提升。

顯然，在外部環境日趨複雜、市場充滿各種不確定性的趨勢下，自主大模型+自主算力是我國算力產業重要組成部分，也是未來發展中一支最為確定的力量。

不過，大模型是一項極為複雜的工程化項目，涉及到基礎設施、大模型、應用等諸多方面，從“可用”到“好用”更是需要不斷努力和持續優化。當前在我國，大模型已正式開啓進入到垂直行業，在大模型的落地中普遍遇到如下挑戰：

首先，我國自主大模型和AI芯片等領域均處於快速發展的階段，在產品力方面取得長足進步，帶來繁榮的產業生態之餘，也讓產品兼容性差、缺乏統一標準的現象愈發突出，給各行各業的使用帶來極大挑戰，亟待產業界正視。

其次，垂直行業有場景、有數據，降本、提質和增效的需求又強烈，對於大模型青睞有加。但大模型的落地與應用極為複雜，遷移、部署過程相當複雜，需要專業的技術人員進行繁瑣的配置和不斷的調試。

第三，大模型徹底改變了基礎設施的規模和複雜性，在訓練和推理過程中出現故障更是“家常便飯”，需要快速有效的故障感知和定位機制來保障 AI 模型的穩定運行。隨着大模型規模越來越大，大模型的高效運維和穩定運行將是一項長期挑戰。

顯然，讓各種大模型+自主算力更好地適配結合和發揮效應，將是“人工智能+”落地的關鍵。為此，超聚變正式推出AI Space大模型加速引擎，通過一站式的大模型遷移、訓練和推理應用開發解決方案，成功打通“人工智能+”任督二脈，讓人工智能應用化繁為簡。

AI Space：打通“人工智能+”任督二脈

大模型從一項技術到具體應用，通常涉及到環境部署、模型訓練和模型應用三個核心階段，每個階段都有着不小的技術鴻溝，並且每個階段都不是孤立存在，這使得很多行業用户面對大模型往往是“想用卻怕用不好“的心態。

如今，AI Space的出現，有望徹底打破大模型應用的尷尬局面。

具體來看，對於大模型落地而言，好的“開局”等於成功的一半。在當前的中國用户中，大模型徹底改變了基礎設施的規模與複雜性，千卡、萬卡集羣在不斷湧現，多元算力環境逐漸成為標配。因此，如何在大規模、複雜的基礎設施環境中，完成包括操作系統、硬件等的適配就成為“開局”的關鍵。

對此，超聚變以完善的工具+專業的服務+豐富的經驗來幫助眾多企業點亮“開局”。藉助自身深厚的操作系統和硬件調優全棧能力，以及自研的開局工具，超聚變AI Space能夠幫助客户快速完成環境部署和調試。

進入到訓練階段，隨着多元異構算力成為標配，以及集羣規模越來越大，加上豐富的應用場景需要不同的算法框架和算子庫來支撐，算力的高效匹配正變得愈發重要。對此，超聚變AI Space 通過開發、重構算子，幫助客户解決硬件架構差異導致的訓練問題，真正讓模型訓練“跑起來”。此外，超聚變的模型調優服務，解決精度和性能問題，提升模型訓練效率。以LSTM模型為例，LSTM模型算子經過調優後，FP16性能提升了 24.28%, FP32性能提升了 28%以上。

在模型應用階段，AI集羣規模越大，故障中斷和集羣重啓的情況越多，容易導致集羣可用性差和大模型應用打折扣。例如，Meta最新報告就指出其Llama 3大模型在萬卡集羣環境中，45天時間出現數百次故障報錯，對於基礎設施挑戰可見一斑。因此，大模型的故障感知和快速定位，是確保AI集羣和大模型用好的關鍵所在。

超聚變的解決思路，是通過AI Space來實現大模型故障感知定位套件實現故障自動感知、自動分析，加上海量客户調優和故障解決的經驗，確保AI 模型在訓練和推理過程中的穩定運行。此外，超聚變還通過AI 開發及應用平台，對 AI 計算資源實施統一分配調度，實現了 AI 模型從開發到推理部署的流程化。

可以看出，超聚變AI Space在算力基礎設施和大模型應用之間構建起一道“橋樑”，既幫助用户適配和管理起復雜的基礎設施環境，實現基礎設施層面的化繁為簡和“物盡其用”，又通過算子庫等一系列專業的工具、服務，讓模型層的各類大模型及應用與算力基礎設施得到最優的適配，從而真正打通“人工智能+”落地的任督二脈，助力各種企業加速應用人工智能。

據悉，超聚變AI Space 目前成功支持100+大模型相關項目，解決了 500+大模型的生態適配問題，用户涵蓋金融、互聯網、運營商等多個行業。

多管齊下，超聚變準備好了

大模型等人工智能技術改變世界的“進度條”才剛剛開始。

接下來，隨着中國經濟邁向高質量發展，各行各業將以人工智能為抓手發展“新知生產力”，全面推動人工智能與應用場景的融合，不僅會帶來持續且強勁的算力需求，也將推動算力產業加速變革。

如今，一個AI算力成主導、通用算力與AI算力相互配合的智算時代已經到來。作為算力產業的排頭兵，超聚變正在從產品、生態等多個維度發力，全面助力中國算力產業變革。

從產品層面看，超聚變憑藉紮實的研發體系和實力，正走向產品創新的厚積薄發，涵蓋液冷服務器、大模型加速引擎、訓推一體機、操作系統、算力管理軟件等。例如，在本次算力大會上，超聚變的FusionPoD for AI新一代全液冷整機櫃GPU服務器獲評“算力中國·年度重大成果”。

如果説，大模型AI技術是算力產業進化的根本因素，那麼生態的繁榮則是算力產業持續進化和做大做強的關鍵。力產業發展到今天，生態的重要性愈發突出。從本次算力大會可以看出，超聚變對於算力生態的重視。

例如，超聚變攜手用户、芯片廠商、設備商、以及產業組織和高校共同成立了液冷AI開放聯盟。眾所周知，液冷市場如今異常火爆，液冷技術鏈長且複雜，涉及到液冷數據中心繫統架構層、液冷部件及接口層、液冷機櫃等，需要超聚變這樣的產業龍頭來牽引，實現產業整合、標準統一和生態繁榮，讓液冷技術更好地支撐起人工智能應用。

又如，安全問題在數字經濟時代愈發突出。為此，超聚變攜手黃河科技、雲智信安、河南綠盟等企業，共同成立中原網絡安全生態聯盟，在產品、方案、市場等多個維度展開深度合作，共同打造安全可信的中原數智化生態，為千行百業的數智化轉型保駕護航。

綜合觀察，在數字經濟的帶動下，算力產業走向高質量發展已是大勢所趨。超聚變作為算力產業的中堅分子，以產品創新和生態建設為主線，充分釋放算力價值，全力驅動大模型等人工智能技術在各行各業中的落地與應用，為數字中國的建設注入持續的源動力。