DeepSeek和國產機器狗之後,華為雲超節點也來了_風聞
宁南山-宁南山官方账号-1小时前
關於中國科技的發展,我最近聽到一個觀點,那就是在這兩年,中國科技的發展在從以前的追趕式開始進步到原創並跑階段。
以前是西方有的,我們也要有,西方封鎖我,那麼我們一定要把西方封鎖的技術搞出來,帶有一種頭懸梁錐刺股,破釜沉舟式的“悲壯”意味,比如我們在中國工業發展的不少領域,都聽到過“爭氣機”的説法,
一般都是我們沒有這項技術,然後我們去買人家不賣,或者故意出高價,還諷刺我們永遠做不出來,最終我們奮發圖強,一舉做出了這項技術。
這樣的故事相信大家一定看到過類似的版本。
在以前我們想的也是更多是先填補技術國內空白,先把這個東西做出來,但現在情況不一樣了,中國科技已經開始有原創領先科技爆發的態勢。
正如DeepSeek創始人梁文鋒説“中國AI不可能永遠處在跟隨的位置。我們經常説中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。”
國內新一代科技人才已經有了這個覺悟。
過去的幾個月,從DeepSeek到宇樹科技國產機器狗等國產新技術不斷的湧現,而且都是世界級的創新成果。
前幾天我看美國財政部長當地時間4月2日接受採訪的視頻,他説美國科技七巨頭(英偉達,亞馬遜,谷歌,特斯拉,蘋果,微軟,Meta)的股價大跌是因為deepseek的發佈,而不是美國政府的貿易保護主義。
不管他説的對不對,
能被美國人拿來當成美國科技企業股價大跌的理由,説明了至少兩點,
一是中國AI技術進步是得到了對手肯定的,
二是AI技術真的非常重要
其實對應美國的科技七巨頭的話,我們也可以列出國內的科技七巨頭,我腦子裏最先冒出來的是華為,大疆,DeepSeek三個,
當然不管怎麼列舉,華為肯定會是其中之一,
另外就是不管怎麼列舉,國產科技七巨頭也肯定都在AI方面有不少研究和投入。
到2025年的今天, AI已經是確定性的趨勢,日常生活中已經有大量想不到的AI應用。
1:AI在讓人類生活更方便
我看到一個有意思的事就是燒烤店數籤子算錢,不需要服務員一根根的去數了還容易數錯,直接拿手機拍照就能自動識別有多少根籤子。
2:AI在創造更多的娛樂方式
在過去的一年,你有沒有在不知不覺中發現在短視頻平台,在AI大模型APP裏面,讓圖片里人物動起來跳個舞之類的特效已經越來越多了?這其實也是AI技術在你不知不覺中進步,在之前就沒有這個功能。
現在各種大模型APP裏面有很多可以對話的智能體,還可以克隆你的聲音,很有意思。
3:AI在增加人類的安全性和存活概率
再比如汽車的自動駕駛,華為發佈的尊界都已經是按照L3來設計了,安全性又上了一個台階,就看國家法律法規什麼時候跟進L3了。
其實儘管不要過分依賴智駕一直是個社交媒體上面的熱門話題,但是常識告訴我們,過去的幾年智駕其實拯救了不少生命,尤其是在智駕車型普及很高的中國,這個數量我相信是全球最高的。
4:AI關係到國家安全和生存
原因很簡單,因為AI可以用於軍事和武器,
舉個例子,下圖是《終結者4》電影裏面攜帶武器,可實現無人駕駛和自主攻擊摩托車,這個電影是2009年上映的,當時覺得這一幕很科幻,
但是我們現在再看的話,已經從思想上並不覺得這是科幻片了,而是覺得這已經是在當前的技術上可以實現的東西。

因此我們更進一步,正因為AI關係到我們生活的方方面面,所以AI技術的進步與否就直接關係到一個公司乃至一個國家財富的多少,上面美國財政部長説DeepSeek直接影響了美國科技七巨頭的股價就是例子,那可是實打實的錢啊。
由於AI技術如此重要,因此我們自然也會關心國產AI技術的進步,那就是一個AI應用(大模型),一個AI軟硬件基礎設施。
我們先説大模型部分,大模型其實可以看成是應用,
2024年年底和2025年初deepseek陸續發佈了V3和R1,火爆了全球,代表的是成本的下降,可以説在deepseek之前,人類的算力需求增長和成本是可怕的規模,以致於市場給了類似英偉達極高的預期,英偉達的市值在2025年1月7日這天創下了3.75萬億美元的歷史巔峯。
而有了降成本的deepseek之後,使得市場終於降低了對英偉達的預期,
注意我並不認為算力總需求會下降,只是會從爆發增長走向正常增長。
舉個例子,在其他因素不變的情況下,參數量多少和算力需求是成正比的,Deepseek 發佈的V3和R1滿血版都是671B的參數,也就是6710億個參數,而上一代版本,2024年5月發佈的V2的參數量就只有2360億,總體還是增長的,而Deepseek更為複雜的下一代參數量還會更大,
再比如deepseek 開源大模型展現出來的良好性能,將會刺激千行百業進行部署基於deepseek的推理應用,刺激對算力的需求。
所以Deepseek的出現使得AI算力需求增長進入更為良性的軌道,更低的成本將大大推動AI的普及,總算力需求仍然是增長的。
這就跟所有的產業發展是軌跡一樣的,
當年九十年代的大哥大一部就得上萬元人民幣,後來隨着成本降低,單台價格下降了90%以上,普通人也逐漸買得起了,市場的總規模並沒有縮減,是不斷增長的。
再説AI基礎設施部分,這部分我不得不説,華為扛起了中國AI基礎設施技術發展的重任。
強大的AI社會需要強大的AI基礎設施,在美國這個基礎設施供應商是英偉達和亞馬遜雲,英偉達提供底層硬件,亞馬遜以雲的形式提供算力服務。
在中國的話,最大的能對標英偉達的廠家就是華為了,同時華為雲也是中國最大的雲服務供應商之一,為政府和千行百業提供算力服務。
美國政府一直在為自家企業保駕護航,所以早早的就盯着華為,
2019年6月把華為列入實體清單;
又在2020年9月就禁止了全球芯片代工廠家為華為代工。
當然華為在自己努力下,終於實現了芯片製造的自主供應,
但芯片工藝製程的限制,還是影響了中國AI硬件的單卡算力進步,所以論單卡算力,華為的昇騰目前比不上英偉達。
也正是因為如此,所以美國從2022年底開始逐漸禁售了英偉達的H100/H800/A100/A800等高端算力芯片。
但是華為並沒有放棄,而是採取多路徑的方式進行技術攻關,
一方面是在半導體設備研發製造方面有所動作,今年3月底在上海召開的SEMICON China 2025半導體展會上公開亮相的某半導體生產設備公司,其各種以“山”命名的設備,加上含有“凱旋歸來”意味的名字,讓廣大網友一下子就猜出了其血統。
另一方面華為也在AI基礎設施技術方面不斷探索進步,
華為雲在4月10日發佈了CloudMatrix 384超節點技術,成功實現超節點技術商用,在當下先進工藝製程尚未突破的情況下,這也是華為持續追趕英偉達的關鍵。
同時通過雲服務的形式,向國內各行各業提供超節點技術算力,
因為隨着企業對AI應用需求的規模越來越大,那麼需要的算力就會增加,企業會走向千卡甚至萬卡數據中心算力集羣,
而這個集羣內各個節點的通信就成為發揮性能的瓶頸,這就好比一支龐大的軍隊,如果各個單位之間不能及時有效的通信,那麼戰鬥力就會大打折扣。
想象一下,如果算力集羣中一張算力卡已經完成了計算任務,但是數據卻不能快速地流動到其他算力卡進行計算,導致大量算力卡在閒置和等待,這就讓集羣性能不能充分發揮。
什麼是超節點?
當前業界一台算力服務器通常是8張算力卡,這一台服務器就稱為一個節點,在一台服務器以內的8張卡之間的通信速度是非常快的,
而相比之下服務器與服務器之間的通信速度則慢的多,其速度相差甚至能夠達到10倍以上,也就是説一張算力卡和同一個服務器裏的另一張算力卡,以及和另一個服務器的算力卡通信速度是天壤之別。
不僅僅是算力卡之間,算力卡和內存之間的通信也是一樣的,
和同一個服務器節點裏面的內存通信,速度要比和跨服務器的內存通信要快的多。
所以如果能用高速通信技術把更多張算力卡,內存融合在一起,成為一個超節點,超節點內的算力卡,內存都可以實現高速互聯和通信,這就能大大的提高算力集羣的性能。
當然,這不僅需要有深厚的通信技術積累,也需要有軟件來進行大規模協同。
英偉達已經率先在2024年3月發佈了NVL72超節點,可以把72張訓練卡組成一個超節點。
而華為雲在4月10日發佈的CloudMatrix 384超節點技術則更進一步,可以實現384張昇騰算力卡成為一個超節點,這不僅是中國最大的商用超節點,而且超節點規模比英偉達的NVL72更大,算力更強,性能比NVL72更優。
或者換句話説,它是目前已商用的超節點中,單體規模全球最大,有效算力全球最高。
超節點充分發揮了華為在通信領域的技術積累和優勢,使其能在國內率先突破和領先,畢竟華為是全球領先的通信廠家。
目前國內在AI基礎設施的趕超方向我認為是比較明確的,
那就是近兩年朝超節點方向發展,未來則單卡算力會發力,原因如下:
其一隨着算力的增長,國內需求千卡集羣,萬卡集羣的數量越來越多,而大規模集羣必然會涉及到高速通信互聯,以及網絡負載算法等通信相關的技術,在這些技術方面中國目前是沒有限制的,尤其對華為而言這還是強項,超節點會符合國內算力需求增長的需要。
其二單卡算力主要和芯片工藝製程相關,因此在生產設備突破後會迎來一個躍升,但這個突破的時間會在未來幾年,到時候單卡算力的提升會比現在更快。
對於國內千行百業的企業而言,除了少數具備極強IT技術和運維能力的頭部客户,大部分企業都會選擇類似華為昇騰雲服務這樣的雲廠家,而非選擇自建數據中心。
原因很簡單,可以總結為四點:
1:超節點在提升性能的同時,也有更大的算力規模,自建的話一次性投入成本高,而在使用雲服務時,你既可以選擇租用一個超節點,也可以選擇只租用超節點的一部分,相比自己購買更為靈活。
2:超節點更為複雜的技術架構也意味着對運維團隊的技術能力要求更高,需要解決的各種故障和運維問題更復雜,
對於一般企業而言,顯然沒有必要維持一個高成本的運維專家團隊,還是直接把底層軟硬件的運維和穩定性直接交給雲服務廠家比較簡單。
例如華為的昇騰雲服務可以實現萬億參數模型長達40天的長穩訓練,遠優於業界平均無中斷2.8天的水平,故障實現從業界平均的60分鐘恢復縮短到10分鐘內恢復,不需要從頭重新訓練。
3:現在國內雲服務廠家是算力節點在地理佈局上已經非常完善
例如華為雲在全國就有3+N+X雲數據中心,其中這個三是指內蒙烏蘭察布,貴州貴安,安徽蕪湖三個最大的數據中心,部署了幾萬張昇騰卡的算力,需要超節點服務時可以分鐘級開通昇騰雲服務,
而華為雲其餘N+X數據中心也是遍佈全國,在服務時延和數據傳輸成本上都可以就近,從而得到低成本的良好體驗。
4:國產AI硬件的進步速度將會加速
這是我的一個判斷,因為從2018年以來的七年,在美國在半導體領域的強力狙擊下,中國半導體產業不得不開始補短板,強基礎的艱難過程,因此國產硬件性能的進步也放緩了。
而在七年後的今天,基礎實力已經大大增強,國產半導體生產設備,材料技術已經不可同日而語,可以説有一種已經在突破前夜的感覺。
以華為云為代表的國產超節點技術今年的率先商用,其他國內廠家預計也遲早會跟進,因此可以預期的是國產AI硬件的技術進步將會加速。
而選擇雲服務則不會面臨技術快速進步下,出現硬件過時的問題,
你需要多少算力雲服務廠家就給你多少,你不需要去關心底層的硬件資源,這也省去了若自建可能會導致硬件資源因為過時而閒置的煩惱。
從目前的情況看,華為在外部壓力下,成功的實現了兩個重要的成果:
在國內人工智能需求猛增的情況下確保了AI軟硬件基礎設施的交付,使得國內的算力需求方可以快速的獲得華為雲提供的算力服務,避免了國內的算力短缺,我們今天在國內能夠大量的享受和使用各種AI應用帶來的好處,華為是做了很大貢獻的;
另一個重要成果就是在實現了國內AI基礎設施技術的持續進步,今年華為雲超節點技術的商用就讓國內的算力基礎設施服務進入了更高性能的時代。
而展望未來,我可以比較確定的説,超節點之後的下一次國產AI基礎設施技術的進步,也會是來自華為。