中國算力,如何像水和電一樣自然流動?_風聞
半导体产业纵横-半导体产业纵横官方账号-探索IC产业无限可能。08-27 18:41
火熱的大模型訓練,讓算力成了AI時代像石油一樣的稀缺資源。
2023年—2024年之間,智算中心成了“新基建”的主旋律。數據顯示,截至2024年9月,我國算力規模已達246 EFLOPS,智能算力同比增長超65%,各行業算力應用項目超過1.3萬個。然而,與智算中心建設的火熱形成鮮明對比的是,今年其實際運營狀況堪憂,平均機櫃利用率僅 20%~30%,部分企業級中心甚至低至10%。
“量”的突破並未帶來“質”的同步,對於中國算力落地的尷尬,半導體產業縱橫採訪了無問芯穹生態總監張帥,深入探尋無問芯穹針對這一困境的破局思路與實踐路徑。
01
算力很多,但用不起來
評估智算中心的算力使用情況,上架率和點亮率是兩個關鍵指標。上架率關注的是設備是否安裝上架並通電可運行,而點亮率關注的是設備是否在實際執行計算任務,為業務所用。據中國信通院報告顯示,全國已上線的智算中心,算力的整體利用率僅32%。
4月16日,關於地方發展改革委摸排算力的信息開始爆出。據報道,多地將陸續下發關於開展算力摸底有關工作的通知,摸底工作涉及已建、在建和擬建算力中心項目,摸底數據將作為國家算力資源統籌佈局的重要依據。據報道,相關部門此舉旨在從更高層面統籌規劃,避免各地盲目重複建設。在業內人士看來,監管的最新動作,一定程度折射出行業面臨的供需失衡、資源錯配等結構性問題。下一步,算力基礎設施建設有望進入提質增效的新階段。
細看國內的算力市場,三個層面的問題尤為突出:
第一,優質算力供給不足,許多企業難以找到符合業務需求的算力資源。大部分智算中心的規模都在1000P(1P算力每秒能夠進行一千萬億次計算)上下,由非常分散的社會資本建設,這些資金不懂行業,很難去找到合適的需求方。
第二,使用門檻過高。找不到、用不起算力,是目前創業公司面臨的普遍問題。有的公司找到了算力,但面對這些裸金屬疙瘩,又不會用。
第三,國產芯片生態存在割裂。國內特有的AI基礎設施情況是多模型和多芯片,存在大量的異構算力,不同廠商的芯片架構和指令集互不兼容,導致算力資源無法實現高效流動。由於生態還不完善,一些國產卡企業用不起來。
於是今年的智算中心出現了一種新的現象:人工智能企業“算力荒”,智算中心卻在“賣卡”求生。在“多芯片”無法與“大算力”畫等號的情況下,無問芯穹切入了算力賽道。
02
清華系的“理想主義”
2023年5月,清華大學電子工程系教授汪玉作為發起人,其博士生夏立雪、戴國浩等人聯合創立了無問芯穹。這家公司的誕生,帶着鮮明的清華基因——汪玉是國際電氣與電子工程師協會會士,清華大學電子工程系主任,也是AI芯片公司深鑑科技的聯合創始人之一,後者在2018年被賽靈思收購。夏立雪本科和博士均畢業於清華電子系,研究方向是AI芯片與算法協同優化。聯合創始人顏深根曾擔任商湯科技數據與計算平台部執行研究總監,帶隊搭建過萬卡集羣,現任清華大學副研究員。這種純正的清華背景,讓無問芯穹在成立之初就獲得了資本市場的青睞。成立不到兩年,公司已完成近10億元融資,投資方包括紅杉中國、百度、智譜AI、啓明創投、君聯資本等知名機構。在AI算力這個硬科技賽道,這樣的融資速度和規模並不多見。
資本認可的不只是無問芯穹的背景,更是無問芯穹的野心。
無問芯穹將公司定義為大模型時代的“算力運營商”。核心目標直指中國算力市場的痛點:在英偉達CUDA生態佔據絕對優勢的背景下,國產芯片廠商各自為戰,開發者每更換一種硬件就需要重新適配代碼,這種生態割裂嚴重製約了國產算力的實際應用價值。
國產卡也好,英偉達卡也好,對使用者來説,能完成任務的就是好算力。針對這種情況,無問芯穹打造以“M×N”為特點、將全局的異構、異域、異屬的算力匯聚成一張“智能感知、即時發現、隨需獲取”雲端算⼒網絡,不僅連得起來,還調得出來、調得過去、調得準。在技術實現路徑上,無問芯穹的策略一是通過統一的中間層屏蔽硬件差異,讓開發者無需關心底層芯片;二是針對大模型的訓練、推理等場景優化國產芯片的性能表現,把使用差距壓到體感閾值以下。
這種技術理念,在第二十屆研電賽中得到了驗證。作為命題企業,無問芯穹設置了“端側/雲側協同應用電子設計挑戰賽”,吸引了25支高校團隊參與。最終入圍決賽的作品涵蓋端側AI加速器、機器人控制框架、智能檢測等多個領域,展現出年輕開發者在技術深度和應用廣度上的雙重突破。“我們希望通過產學研用協同機制,縮短科研成果產業化的週期。”無問芯穹生態總監張帥表示。在研電賽中,公司不僅提供了真實的產業命題,更將企業的技術需求直接反饋給高校團隊。“通過聯合培養既懂算法又懂硬件的複合型人才,共同構建從底層芯片到上層應用的完整AI基礎設施生態,加速人工智能技術在各行各業的規模化落地。”
03
三個“盒子”的野心
無問芯穹作為一家成立僅兩年多的初創公司,正處於產品打磨和早期商業化落地的階段,以雲端結合的方式推進商業化進程。在談到無問芯穹如何通過技術與生態佈局保持競爭力時,生態總監張帥給出了三個關鍵指標:“易用性、穩定性和性價比。”
2025世界人工智能大會上,無問芯穹推出了全規模 AI 效能躍升方案的三大核心產品,被形象地稱作 “三個盒子”。這三個產品涵蓋了服務從萬卡至十萬卡全局算力網絡的“無穹AI雲”,到服務百卡至千卡級大型智算集羣的“無界智算平台”,再到服務單卡至十卡級有限算力終端的“無垠終端智能”解決方案,試圖在單卡至十萬卡算力的全規模軟硬件場景中,釋放每一份算力的最大潛能。
大盒子:無穹AI雲
無穹AI雲的底層是⼀張深度覆蓋全國的廣域算力網,基於無問芯穹“一網三異”調度架構,目前已經成功覆蓋“東數西算”國家戰略佈局的關鍵節點,匯聚了來自 26個省市、53個核心數據中心的龐大算力資源,整合超15種主流芯片架構的異構算力池,總算力規模超25000P。基於強大的廣域高性能專線內網互聯互通,用户能夠按需在不同地域、不同型號的算⼒資源之間進行即時切換與無縫遷移。充分體現了“易用性” 與 “穩定性” 的設計理念。
中盒子:無界智算平台
“中盒子” 面向百卡至千卡級大型智算集羣,以 “全鏈路解決方案” 提升算力性價比。據瞭解,在與上海算法創新研究院的合作中,它基於 3000 卡沐曦國產 GPU 集羣,穩定支撐百億參數大模型訓練 600 小時不間斷,創造了國產算力訓練紀錄。服務雲南移動時,高效利用 2000 張華為昇騰 910B 加速卡,實現千億參數模型的分佈式部署與大規模推理,為商業化服務注入核心競爭力。這些案例印證了其在複雜場景下的穩定性與性價比優勢。
小盒子:無垠終端智能
“小盒子” 針對單卡至十卡級的有限算力終端,讓終端算力好用又經濟。攜手上海創智院共同打造的全球首款端側本徵模型無穹天權Infini-Megrez2.0,在實現雲級21B參數智能水平的同時,將內存佔用控制在7B規模、實際計算量控制在3B規模,突破了終端設備的資源侷限,可以完美地適配當下的各類終端設備,成功打破了終端“能效-空間-智能”的不可能三角,讓終端設備無需依賴雲端也能完成複雜任務,進一步擴展了算力服務的邊界。
04
結語
當無問芯穹服務的全球最大人工智能孵化場景——上海模速空間的算力調度大屏顯示日均Token調用量突破100億時,這個數字背後折射的不僅是一家企業的成長,更是中國算力生態的艱難蜕變。無問芯穹的“三個盒子”正在嘗試解答一個產業級命題:在芯片性能暫時落後的客觀條件下,如何通過系統級創新釋放國產算力的潛在價值?
面對“算力碎片化”與“成本高昂”的問題,無問芯穹通過底層的算子、通信、調度、容錯等方面的技術創新和實踐,大幅提升算力資源的實際利用率,顯著提升單位算力的性價比和服務質量。據瞭解,異構情況下的確出現過相同數量的國產芯片加上國際主流芯片,訓練表現不如單獨國際主流芯片的情況。隨着技術的逐漸成熟和上下游生態的共同努力,如今,部分不同芯片混合的算力利用率最高能達到97.6%,使用者已幾乎感覺不到算力異構的體驗差異。
在這個算力定義AI競爭力的時代,中國需要的不僅是更多的智算中心,更是一套能讓算力真正流動起來的生態體系。當開發者可以像使用水電一樣調用國產算力,當芯片廠商能根據真實場景需求迭代產品,中國AI產業才有望走出“有算力難用”的困境。
無問芯穹的實踐,正為這場生態突圍提供着珍貴的樣本。