“IPv6+”智能雲網,構建算力時代的聯接底座
2022年4月2日,華為數據通信產品線研發總裁劉少偉接受央視《對話》欄目的採訪,暢談“東數西算”和算力時代,闡述華為如何基於“IPv6+”創新技術打造算力時代的聯接底座,並提出算力網絡的長期目標是構建 “全國一台計算機”,算力將成為一項公共服務,用户可以隨用隨取。

《對話》欄目:算力時代的中國機會
實現算力需求和雙碳目標平衡,“東數西算”恰逢其時
近日,國家發展改革委、中央網信辦、工業和信息化部、國家能源局聯合發佈《全國一體化大數據中心協同創新體系算力樞紐實施方案》,提出在京津冀、長三角、粵港澳大灣區、成渝以及貴州、內蒙古、甘肅、寧夏建設全國算力網絡國家樞紐節點,啓動實施“東數西算”工程,構建國家算力網絡體系。
“東數西算”是把東部地區的非即時算力需求以及大量生產生活數據輸送到西部地區的數據中心進行存儲、計算並反饋。與“南水北調”、“西電東送”、“西氣東輸”等超級工程一樣,“東數西算”的根源在於國內資源供給的不平衡,需要跨越地理維度解決資源分配問題,是實現未來爆炸式算力需求和雙碳目標平衡的最優解。
從算力需求來看,截止到2022年初,國內已建成的數據中心為500萬標準機架,整體算力達到130EFLOPS,國家整體算力以20%速度持續增長。而且從數據增長情況也能看到端倪,到2030年,80%的數據增長都是非結構化數據,這些數據的處理更多需要AI算力來支持,未來AI算力預計將有500倍的增長。

在算力需求高速增長的同時,我們也看到東、西部算力規模和發展並不均衡。根據中國信息通信研究院在《中國算力發展指數白皮書》中給出的數據:東部省市對算力的需求普遍較高,其中算力需求大户互聯網企業集中的北京、廣東、上海的算力規模位列前三;浙江、廣東、江蘇等東部省份算力增速超過60%;內蒙古、貴州、甘肅等西部省份算力規模和增速偏低,數據中心上架率不足。
從數據分類角度來看,主要分為熱數據、温數據和冷數據三種類型。熱數據是處理時間要求高、需要立刻做決策並運算的數據,例如自動駕駛、遠程醫療等,端到端傳輸時延需要小於10ms,熱數據只佔總數據量的5%;温數據是訪問頻率介於熱數據和冷數據之間的數據,傳輸時延在10-30ms之間,佔總數據量的15% 。冷數據一般指的是時效性需求不太高、對時延不敏感的數據,例如數據備份和離線訓練等,傳輸時延在30ms以上,冷數據佔比達到總數據量的80%; “東數西算” 將即時性要求不高的業務部署在西部節點,能夠促進數據中心集約化、集羣化發展。
從資源角度來看,東部數字經濟發展迅速、算力的需求量大,但能源和土地資源有限。而充足的清潔能源保障、低成本電價、相對低廉的土地供應成本以及涼爽的氣候,是西部地區的優勢,也是發展數據中心、承接東部算力需求的基礎。據統計,西部地區可再生能源資源佔全國資源總量的70%以上,而且由於環境優勢使數據中心能效比PUE可以做到1.2,優於東部平均值1.5。假設每1萬機架部署在西部綠色能源區域,就可節約3億千瓦時電力,減少20+萬噸碳排放,相當於種下1300萬棵樹。
實施“東數西算”工程,將推動數據中心合理佈局、優化供需、綠色集約和互聯互通,有利於提升國家整體算力水平,實現整體資源的最優化配比,降低算力使用成本,促進算力普惠,同時有利於推動區域協調發展,打開了西部開發新格局,“東數西算”建設正逢其時。
算力是加速行業數字化及經濟社會發展的重要引擎
算力作為數字經濟的物理承載,正在像水和電一樣成為個人和企業社會活動中不可或缺的基礎需求。近年來,各國紛紛制定行動計劃,不斷運用算力助推經濟增長。從數據分析來看,全球各國算力水平與經濟發展水平呈現顯著的正相關,根據《中國算力發展指數白皮書》,每1元的算力投入,可以帶動3-4元的經濟產出。
在實際的生產和生活中,算力發揮的作用已經超出我們的想象。比如,傳統藥物研發面臨週期長以及成功率低的問題,一款新藥研發週期通常為6到10年時間甚至更長,且從規劃到最終上市成功率不足10%。算力在新藥研發規劃、新藥設計、藥物臨牀試驗等新藥研發環節中可以發揮重要作用,通過對包含有基因、蛋白、化合物分子結構等信息的生物大數據以及海量的臨牀大數據進行分析處理,使得新藥研發上市週期顯著縮短,快速應對診療需求或公共衞生問題。再比如,清潔能源如光伏、風電等,由於天氣情況的導致不可預測性,產生的電能併入電網難度大,出現部分棄風、棄光等現象。隨着AI算力的發展,未來可以將氣象和能源結合,通過天氣、風速等精準預測,構建清潔能源發電數據預測模型,通過跨界創新,更準確的進行控制和調度,提升清潔能源使用效率。 未來,算力將發揮更大的作用,更深層次改變我們的生產和生活方式。
華為基於“IPv6+”創新技術打造算力時代聯接底座
在算力時代,算力是中心,網絡是根基。類似於“西電東送”的發電廠和電網,算力網絡由提供算力的數據中心和輸送算力的網絡組成,連接着用户、數據和算力。“東數西算”是一個解決東西部算力規模和增速發展不均、提升跨區域算力調度水平的系統工程,其中網絡會貫穿算力的生產、傳輸和消費的全流程,需要做到算力高效釋放、算力靈活調度、邊緣最優服務,讓千行百業可以像用電一樣便捷使用算力。
算力高效釋放(數據中心內):數據中心是算力的發電站,必須保證算力的最大產出。由於單台服務器算力有限,需要用網絡聯接成千上萬的服務器組建大規模算力集羣。聯接規模越大,聯接能力要求就越高。比如,海量服務器之間進行數據互訪時,很容易由於流量突發而產生丟包。以RoCE網絡為例,0.1%的丟包會導致網絡吞吐率下降50%,造成算力資源的嚴重浪費。

基於多年技術積累,華為創新地將智能無損算法引入數據中心網絡交換機,攻克了以太網丟包難題。在服務器規模不變的情況下,數據中心內算力最高可提升93%。為了構建超大規模算力集羣,華為將直連拓撲和自適應路由引入以太網領域,目前最高可支持27萬台服務器的零丟包組網,組網規模達到業界平均水平的4倍,網絡跳數和時延可降低25%。未來,華為超融合數據中心網絡將引入網絡級負載分擔技術,實現網絡有效帶寬的倍增;同時通過與服務器網卡等端側配合的端網協同算法,實現單跳動態時延從10-100μs縮短到1μs級,針對人工智能、高性能計算、高性能存儲等業務進一步釋放算力。
算力靈活調度(數據中心間):就像西電東送中的輸變電網絡一樣,算力網絡把算力從西部輸送到東部,算力網絡承載着海量企業成百上千的業務。如果把企業比作嗷嗷待哺的小鳥,那作為算力網絡的鳥媽媽,如何滿足每個小鳥的需求,又能公平高效的給小鳥餵食是個很大的挑戰。一方面,針對每個企業對算力的需求不同,我們通過智能雲圖算法和基於IPv6+的新技術,按照業務實際情況為其提供一條最佳的算力網絡路徑,從而實現供需側的最優資源配置。同時,我們通過切片技術將網絡按業務類型劃分成不同車道,相互隔離,保證算力能夠高效、及時和準確的送達。
邊緣最優服務(邊緣算網): 雲遊戲、自動駕駛、VR/AR、物聯網及工業互聯網新型應用對網絡時延、數據安全可控提出高要求,邊緣計算應運而生。Gartner認為,到2025年,大約超過75%的數據將在邊緣側處理。邊緣算網將是算力網絡的重要場景,邊緣聯接設備數量劇增,聯接要安全可控的保障,算力要即時靈活的提供,都需要邊緣算力與網絡相互感知,實現“網絡+算力”在邊緣的聯合優化調度。解決這個挑戰的關鍵技術就是算力感知路由,華為積極探索算力感知路由創新,實現應用在邊緣算力資源池部署後,網絡從路由層即時感知和擴散業務的算力負載,網絡接入節點根據應用標識對應用進行即時流量調度,從而提升整網算力、存儲、網絡等資源利用率,為用户提供邊緣最優算網服務,實現算力普惠。
隨着網絡與計算的融合,算力資源由“端”變“網”,未來在用户的不同距離上會遍佈許多不同規模的算力,通過網絡為用户提供各類個性化的服務。如何保障用户體驗一致性?如何實現服務靈活動態部署?這些挑戰只在“計算域” 內是無法解決的,需要考慮“網絡域” 與“計算域”如何協同。為了攻克這些技術難題,包括算力感知網絡(CAN)、應用感知網絡(APN)等新技術應運而生 ,通過網絡、存儲、算力等多維度資源的統一管理和協同調度,實現連接和算力在網絡的全局優化,達成業務與資源的最優配置。相關標準也在國內外多個標準組織獲得了廣泛的關注和實質性的進展,其工作組成立預討論會(BoF),吸引了業界200餘位專家積極參與討論,華為與業界夥伴在IETF已經合作發佈了10餘篇APN相關技術文稿。這些工作都為推進相關技術的標準化工作奠定了堅實的基礎。
算力作為數字經濟時代的新生產力,通過基礎設施化,從而廣泛服務於我國數字社會轉型中的方方面面。算力網絡的長期目標就是構建 “全國一台計算機”,算力將成為一項公共服務,用户可以隨用隨取。
在當今數字化時代大潮中,機遇與挑戰並存。華為將持續攜手客户及合作伙伴,共同應對數字化轉型中的挑戰,持續聚焦聯接技術和計算技術融合的算力網絡,用領先的硬件、軟件和算法構建數字世界的智能基礎設施。