黃仁勳要靠梁文鋒逼單_風聞
源媒汇-助力中国好公司!50分钟前
文源:源Byte
作者:柯基的柯
穿着皮衣頂着北京的大太陽,英偉達CEO黃仁勳可不想自己今年第三次的中國之行,就僅僅收穫一張跟小米創始人雷軍的合影。
次日,也就是7月15日,黃仁勳宣佈H20芯片恢復對華銷售,聲稱將緩解中國市場的算力瓶頸,算是幫DeepSeek創始人梁文鋒解了圍。
據知情人士爆料,DeepSeek的R2模型因H20芯片禁售而延遲發佈,官網流量暴跌70%,用户流失至第三方平台,梁文鋒急需R2模型來穩住局面。
作為壟斷全球算力的硬核狠人,黃仁勳出手“搭救”梁文鋒可能更多是從商業層面考慮,畢竟放眼全球,只有眼前這位廣東靚仔依靠“閹割版”的基建,就能對OpenAI、谷歌等一系列國際巨頭持續施壓。
01
相愛相殺
黃仁勳與梁文鋒的關係,可以用“亦敵亦友”來概括。
黃仁勳掌舵的英偉達,是全球AI算力基礎設施的“軍火商”,是支撐頂級大模型發展的核心引擎。而梁文鋒創立的DeepSeek,則以“低成本、高性價比”為標籤,通過算法創新將大模型訓練成本壓縮至行業平均水平的1/20。
在DeepSeek年初爆火出圈的那段時間,它不止顛覆了技術路徑,更動搖了“算力霸權=商業成功”的舊秩序,一度讓英偉達的市值蒸發千億美元。
但如果追根溯源的話,兩人的關係起點應該是合作,2021年,梁文鋒着手提前卡位,意圖購買1萬張A100顯卡,為DeepSeek後續研發奠定基礎。彼時的美國還尚未將該型號列入禁售清單。
在後來的台北國際電腦展大會上,黃仁勳還公開稱讚DeepSeek,他認為,DeepSeek-R1對人們理解AI和推理有巨大的影響,對行業和世界作出了巨大貢獻。
對於老辣的黃仁勳來説,DeepSeek的崛起讓他看到了新的市場機遇。2025年春節後的第一週,搭載8塊H20的服務器價格從年前的100萬元飆升至110萬元,甚至有客户願意加價5萬元鎖定現貨,隨後,這款顯卡一路飆升,截止黃仁勳本年度第三次來華之前,市場價格已經來到了180萬元。
英偉達芯片概念圖 | 源Byte制
這款專為中國市場設計的芯片,雖在浮點運算能力上僅有旗艦產品H100的1/10,但其96GB顯存和900GB/s的NVLink帶寬,恰好擊中了推理場景的命門。
當DeepSeek以560萬美元的訓練成本叫板行業巨頭時,其開源策略點燃了企業部署AI的熱情,但也帶來了副作用:推理服務的穩定性成為致命短板,而H20的“錯位競爭”策略恰好填補了這一需求空白,其4.0TB/s的顯存帶寬足以支撐數十個推理任務並行,而價格僅為H100的1/3。
也就是説,DeepSeek的崛起反而讓H20完美地適配了中國大模型市場,黃仁勳這一次的中國行雖沒有帶來頂級“尖兒”貨,但帶來了最具性價比的選擇。
還是黃仁勳的算盤打得精,在DeepSeek徹底將中國大模型市場定位在彎道超車的性價比路線後,英偉達極有可能將類似H100這類頂級顯卡賣給海外頂級大模型公司,待其升級迭代數月後,再將“閹割版”、“特供版”大批量地出售給中國大模型公司,讓其繼續對海外公司保持競爭力。
畢竟,有競爭才有壓力,有壓力才會讓這些大模型公司不斷提升對算力的需求。
02
梁文鋒又要殺回來了
在R2接連跳票的這段日子裏,梁文鋒的日子並不好過。
一度在大模型內卷中“掉隊”的百度率先發難,百度創始人李彥宏早在4月就公開吐槽DeepSeek“慢且貴”,稱其API調用價格遠高於市場平均水平。
在外界都以為,梁文鋒掏出R2模型將文心一言按在地上摩擦之時,僅僅在5月底推出了DeepSeekR1的改款,但是後續市場反響平平,並未幫助DeepSeek止住頹勢。
截圖來源於DeepSeek官網
根據國際半導體研究機構Semianalysis最新報告,DeepSeek的全球用户使用率已從2025年1月的50%驟降至7月的3%,官網訪問量在2月至5月期間下滑63%。另一家AI模型集成平台Poe的統計顯示,其核心模型R1的使用率在2月至4月間腰斬,從7%跌至3%,而同期ChatGPT和谷歌Gemini的使用率分別增長40.6%和85.8%。
眼見R2模型一拖再拖,一度讓DeepSeek徹底擠下牌桌的“X小龍”們又活躍起來,6月中旬更新的MiniMax-M1模型,號稱世界上第一個開源的大規模混合架構推理模型,其號稱整個強化學習階段只用到512塊H800三週的時間,租賃成本只有53.47萬美金。
來到7月,月之暗面上線的KimiK2模型,同樣選擇了開源,併成為國內開源領域首個總參數量達到1萬億的MoE架構基礎模型。
截圖來源於KimiK2官網
一個有趣的現象似乎可以印證“X小龍”們在R2缺位這段時間內的心情起伏,在BOSS直聘等招聘渠道上,5月份的主流崗位還是各類應用的產品經理,進入到6月就紛紛將其撤下,換成各類工程師與研究員。
畢竟,在為效率買單的AI付費體系尚未成熟的階段,各類應用前途不明,倒不如在R2缺位的階段,在大模型領域再搏一把。即便是Mauns這種一度火出半邊天的爆款,並未在國內市場淘出幾個金塊,在近期甚至傳出“跑路”去新加坡的消息。
甚至,部分國內大廠似乎看到了對DeepSeek取而代之的希望,趕工加點地推出產品,一度讓行業從從“卷技術”轉向“卷參數”,技術標準逐漸模糊化,甚至鬧出了一連串的套殼抄襲事件。
就在7月初,華為盤古大模型被曝與阿里通義千問的代碼相似度高達92.7%,華為的回應堪稱教科書級別的公關話術——“嚴格遵循開源許可”,但開源社區的開發者們並不買賬。這場風波並非孤例。月之暗面與阿里通義的糾紛也被舊事重提,儘管細節模糊,卻足以讓行業陷入信任危機。
“即便R2無法完全超越這些頂級大模型,但至少會給整個行業的發展路徑定調,就是給大家一個如何接近和趕超頂級大模型的路徑,省得只能在這裏無效卷參數。”有開發者對源Byte坦言。
“雖然是一邊唱衰DeepSeek,但行業還是離不開(DeepSeek),畢竟只有幻方知道如何趕超頂級大模型。”上述開發者表示,相比其他國產大模型,DeepSeek至少不會盲目卷參數,且清楚地知道這條追趕之路是什麼狀況。
就當友商們似乎見到光明之時,黃仁勳直接掐滅了火種,他為梁文鋒帶來了期盼已久的H20。據知情人士透露,DeepSeek團隊近幾個月一直在密集推進R2模型開發,但梁文鋒目前對模型的能力仍不滿意,內部仍在繼續提升性能,相應模型尚未準備好正式投用。
黃仁勳帶來的H20,雖然在性能僅為H100的15%-20%,談不上雪中送炭,倒也間接地幫助國產大模型結束抄襲、套殼、參數注水的亂象。
03
芯片解禁,誰的救命稻草?
雖然梁文鋒的R2模型在某種程度上,未來極有可能成為黃仁勳向OpenAI等公司逼單的籌碼,但天下終究苦英偉達久矣,這位鍾愛皮衣的男人同樣需要盟友。
翻開“反英偉達聯盟”的名單,既有OpenAI、Meta、微軟、谷歌、亞馬遜等深度依賴英偉達芯片的科技巨頭,也包括英特爾、AMD、高通等英偉達的直接競爭對手。
來到今年6月,在AdvancingAI 2025大會現場,OpenAI的CEO薩姆·奧特曼明確表示,OpenAI未來將使用AMD的AI芯片。正在構建“芯片-模型-生態”三位一體的全新生態。
這種頂級AI模型廠商與芯片廠商深度合作的模式,可能會引發其他AI領軍企業效仿,加速它們在芯片領域的佈局。
AMD作為英偉達的老對手,在蘇姿豐的帶領下,憑藉在CPU和GPU方面的建樹,提供在性能上能與市場領導者匹敵甚至在某些單點上有所超越、但在成本上更具優勢的產品,以此吸引那些對價格敏感或者尋求替代供應商的客户。
因此,H20這種性能被打了折扣的產品,恰好與AMD的芯片來到了同一賽道。據財報數據,2025年第一季度,英偉達營收達440億美元,在獨立顯卡市場佔據超90%的份額;AMD同期營收74.4億美元,同比增長35.9%(年增36%),超出市場預期的71億美元,增長勢頭強勁。
英偉達已被OpenAI、谷歌、Meta等頭部機構的大模型訓練(如GPT-4、PaLM)驗證,形成“成功案例→行業信任→更多采用”的正向循環;而AMD在超大規模大模型(千億參數以上)的公開成功案例較少,企業在選擇時需承擔“試錯成本”。
就在黃仁勳宣佈H20的第二天,AMD當即表示,在美國宣佈將批准銷售後,公司計劃重啓向中國出口其MI308芯片。AMD的MI308芯片是專為中國市場設計的AI加速器,基於其MI300系列架構,性能足以滿足垂類模型訓練和推理需求。
因此,OpenAI與AMD的合作,在某種程度上為AMD的產品和服務打樣,倘若繼續“禁售”下去,勢必助長AMD在爭取DeepSeek等一眾國產大模型的優勢。
對於黃仁勳來説,這塊最適配H20的市場,又是增速最為迅猛的市場,錯過這一波行情,不知下一次是何年。
根據IDC發佈的《中國模型即服務(MaaS)及AI大模型解決方案市場追蹤,2024H2》報告顯示,2024年中國MaaS市場呈現爆發式增長,全年規模達7.1億元人民幣,較2023年實現215.7%的同比激增,其中2024下半年市場規模達4.6億元人民幣。展望2024-2029年,該市場將以66.1%的年均複合增長率高速擴容,預計2029年市場規模將達到90億元人民幣。
黃仁勳必須要在友商即將要起勢的關鍵階段,果斷出手來打亂節奏,積極遊説美國政府調整政策。
肉眼可見,英偉達將在中國市場狂賺一筆了。
部分圖片來源於網絡,如有侵權請告知刪除