從聯接到賦能,新華三用端網協同加速“人工智能+”_風聞
大数据在线-09-03 13:54
在AI技術飛速發展的熱潮中,智算網絡已不再是傳統的“流量管道”,而躍升為AI算力釋放的“新引擎”,成為推動智算中心持續升級的關鍵變量。
尤其隨着DeepSeek等MoE架構的AI大模型興起,AI大模型的參數量與通信規模持續增加,以及多元算力生態的逐步形成,網絡流量呈現出不確定性、Token帶來的隨機性、流量波峯與波谷交織等新特徵,對於網絡的帶寬、調度、可靠性和擴展性帶來極大考驗。
因此,產業界愈發形成共識:智算中心不能僅依靠簡單的堆砌算力,而亟需構建端網協同的智算網絡,以此撬動整個AI基礎設施資源的高效利用。
近年來,新華三前瞻性提出“算力×聯接”開放戰略,用一系列領先的智算網絡產品與解決方案實現槓桿效應,大幅提升整個智算中心的算力利用率。正如新華三集團高級副總裁、網絡產品線總裁喬剡在第九屆未來網絡發展大會上所言:“在算力狂飆的時代,網絡的價值絕非僅僅是‘成本項’,更應該是‘賦能者’。”
新華三集團高級副總裁、網絡產品線總裁 喬剡
智算網絡需邁過三道坎
IDC《中國人工智能計算力發展評估報告》顯示,2024年中國人工智能算力市場規模為190億美元,同比增長86.9%,預計2028年,市場規模有望達到552億美元,未來幾年將保持高增長。
AI算力的高速增長,背後是AI大模型快速迭代對於算力的極度渴望,以及百行百業對於智能化的迫切需求。在整個智算中心中,智算網絡恰如“高速公路”,承載着澎湃的AI算力。當AI算力狂飆之際,“流量洪峯”也如約而至,且充滿不確定性和複雜性,智算網絡這條“高速公路”如何不“失速”就成為整個產業界的焦點。
在喬剡看來,AI算力的快速發展,正對下一代智算網絡提出三大關鍵挑戰。
智算網絡首先面臨的是單集羣規模不斷提升帶來的超大規模組網挑戰。當萬卡/十萬卡集羣不斷出現時,AI集羣複雜性與脆弱性也隨之放大,如何確保無損傳輸併發揮強勁性能,就需要智算網絡在端口密度、帶寬/徑向與收斂時延上同步演進。
此外,流量調度和端網融合也對智算網絡帶來極大考驗。眾所周知,AI大模型流量具有不可預測性和多變性特點,像集合通信(All-to-All)等高強度交互模式會形成難以預測的瞬間“流量洪峯”,很容易導致網絡擁堵與癱瘓,這需要智算網絡高效靈活的敏捷調度能力,以端網協同支撐起復雜流量的調度。
最後,大部分智算中心並非單一、同質化的算力架構,而是呈現出多元化趨勢。然而,硬件協議、接口和軟件棧的差異,也導致硬件之間“語言不通”,算力協同更無從談起。智算網絡則需要成為多元算力協同的核心抓手,以開放戰略促進多元算力的並存發展,從而充分釋放算力的價值。
“過去,計算、網絡處於相對割裂的狀態。進入到智算時代,AI集羣規模不斷擴大,帶來更加複雜的流量動態和多元算力接入需求,網絡的重要性也持續提升,網絡需要打破割裂的狀態,與端側主動聯動。”喬剡介紹道,“網絡已成為決定算力收益的重要因素,其性能優化、改進對於AI算力意義重大。”
多維創新,讓智算效應最大化
近年來,新華三提出“算力×聯接”的戰略,旨在通過技術架構、產品和解決方案多個維度的創新,實現從傳統RoCE領域的持續創新,到打造新一代無損網絡解決方案,再到全場景定製化智算方案,全方位深化端網協同效應,為AI算力發展構建起開放、高效和智能的“高速公路”,幫助百行百業步入智能化轉型的快車道。
眾所周知,傳統網絡架構一大短板就是技術架構的落後,無法支撐起AI算力高速發展的需求。為此,新華三面向萬卡級算力互聯場景打造出DDC(Diversified Dynamic-Connectivity,多元動態聯接)架構,實現“超大規模、極致性能、開放解耦、智能運維”四大技術突破,高效解決智算網絡中流量擁塞與調度難題,為智算網絡能效提升夯實了全方位基礎。
“DDC架構採用端到端全局調度機制,依託信元交換技術,可以快速適配網絡流量變化和無感切換,很好地契合了智算場景的網絡需求。”喬剡表示。
如今,端網協同已成為釋放AI算力潛能、提升AI集羣效率的關鍵抓手。除了架構層面創新之外,新華三還通過各種算法的創新突破智算網絡各項挑戰。以端網流量的有序協同為例,新華三通過熵值有序分配和增強CBRC算法,利用AD-DC智算版智能管控分析平台實現對於智算網絡全生命週期運維管理,全流程保障高效算力互聯。
此外在產品層面,新華三已經打造出智算網絡產品矩陣,包括傳統RoCE領域、創新DDC架構方案、以及定製化智算產品等,覆蓋互聯網、政府、運營商等多個行業不同規模的用户,可以靈活滿足市場的多樣化需求。
以AI智算交換機為例,新華三本次未來網絡發展大會上正式發佈800G AI智算交換機H3C S9828-128EP。該產品具備128個800G端口,為當前業內單機容量最高;二層組網架構下,相比上一代產品節省70%的設備用量和50%的光模塊用量,全部端口均支持 LPO/LRO 光模塊,實現超低時延傳輸和大幅降低能耗。
事實上,今年以來超節點、AI智能體等新趨勢,也在潛移默化推動智算網絡的持續變革。以超節點為例,突破單服務器、單機櫃的限制,對於高速互聯、集羣協同、節點間通信和延遲性能提出了更多複雜需求;另外,智能體的崛起和進入到網絡運維領域,也讓智算網絡的運維模式產生重要影響。
“對於中小規模的智算集羣而言,超節點是一個很好的方案。不過,超節點的關鍵是需要在一個相對緊湊的空間做出彈性、高可靠和快速交付的智算系統,考驗廠商的複雜工程能力。”喬剡直言道:“AI賦能網絡也是一個重要趨勢,但會是一個循序漸進的過程,智能體對於協助運維工程師提升工作效率和快速積累有很好幫助。未來的網絡運維機制將是人機協同,運維人員通過多智能體組合進行優化和運維,最終決策還是需要人。”
開放的智算網絡,讓“人工智能+”行穩致遠
人工智能已上升為我國的國家戰略。近日,國務院又正式發佈《關於深入實施“人工智能+”行動的意見》,確定實施科人工智能+科學技術、產業發展、治理能力等六大重點行動,明確分2027年、2030年、2035年三階段推動人工智能與經濟社會各行業各領域廣泛深度融合。
可以預見,隨着《意見》的頒佈,百行百業將加速走向智能化,智算中心將成為眾多行業智能化轉型不可或缺的數字底座。這其中,一個開放和持續的智算網絡對於加速“人工智能+”行動計劃至關重要。
眾所周知,封閉的技術生態在早期固然可以快速構建起門檻,但從長期發展來看則會成為產業創新的桎梏 。而智算網絡的未來,將不僅僅是帶寬和性能的競賽,更是開放性和協同性的博弈。
尤其考慮到當下國內市場面臨着先進AI算力稀缺、國產AI算力呈現多元化和有待成長的現實狀況,一個開放的智算網絡對於未來智算中心發展意義重大,開放不僅能夠推動多元算力的適配、接入和互通,還能激發AI算力的創新活力,更有望帶動產業標準的建立,以及加速行業智能化的進程。
無疑,新華三是目前市場中致力於構建開放智算網絡的重要代表,無論是“算力×聯接”的開放戰略,還是DDC技術架構,亦或各種組網方案,新華三將開放的理念貫穿戰略、技術和產品方案等多個層面,並與產業鏈上下游夥伴共同打造開放、多元、可持續的智算生態。
“新華三會通過先進的工程實踐,繼續深耕全域智算產品研發,並堅持多元芯片戰略,致力於攜手產業鏈夥伴建設開放標準,為行業的智能演進構築基石。”喬剡最後總結道。