DeepSeek:誰是CEO?一個幽靈如何威脅美國的人工智能主導地位 - 彭博社
bloomberg
梁文峯身材瘦削、性格內斂,在會議中可能顯得害羞——甚至有些緊張。這位最近顛覆人工智能領域的中國初創公司深度求索的創始人,説話時常常結巴,還會陷入長久的沉默。
但新員工很快就會發現,不應將他沉靜的性格誤認為膽怯。當梁文峯消化完討論的細節後,他會拋出關於模型架構、計算成本以及深度求索AI系統其他細節的精準而難以回答的問題。
一月份的梁文峯。來源:Zuma Press員工們稱梁文峯為“老闆”或lǎo bǎn ——這是中國對上級常見的尊稱。但不同尋常的是,這位lâo bân非常鼓勵年輕研究員甚至實習生大膽嘗試大型實驗項目,經常到他們工位瞭解進展,並激勵他們探索非傳統的發展路徑。
討論越技術性,他越投入。尤其是當這些討論能帶來實際性能提升時——梁文峯會親自在內部通訊平台Lark上分享這些里程碑。“他是個真正的技術狂,”一位不願透露姓名的深度求索前員工表示(和本文其他受訪者一樣),“有時我覺得他比研究員們更懂研究。”
梁和他的年輕公司在一月份因發佈R1而全球聞名——這是一個看似取得真正突破的AI模型:R1在多個用於評估AI性能的標準測試中擊敗了佔據主導地位的西方參與者。
然而,深度求索聲稱其基礎模型的開發成本僅為GPT-4(OpenAI的ChatGPT所基於的模型)預估成本的5%左右。
這些測試結果引發了美國市場高達1萬億美元的拋售,並對美國通過出口管制遏制中國AI進步的戰略提出了棘手問題。亞馬遜和微軟競相將深度求索模型納入其雲服務產品,與Meta和Mistral AI等競爭對手展開較量。“基本上,短短一個週末內對深度求索的興趣就激增到讓我們不得不採取行動的程度,“亞馬遜.com語言模型市場負責人阿圖爾·迪歐表示。
深度求索生動展現了美國如何看待中國AI領域的大部分情況:神秘莫測,容易被當作誇大其詞的威脅而忽視,但實際可能比他們願意承認的更令人不安。在這家初創公司出現之前,許多美國企業和政界人士認為中國仍明顯落後於硅谷。這似乎讓他們有時間為可能的平起平坐做準備,或阻止中國實現這一目標。
美國在私人AI投資領域處於領先地位
來源:Quid,由斯坦福大學AI指數彙編
事實上,杭州——深求科技(DeepSeek)等中國高科技中心的所在地——充滿了被稱為“幼龍”的AI初創企業。本土初創公司如MiniMax和Moonshot AI開發的複雜聊天機器人,在美國也迅速贏得了越來越多的喜愛。
阿里巴巴開源AI平台Qwen的語言模型在谷歌和Anthropic的大型語言模型(LLM)排名中一直名列前茅。百度CEO李彥宏在四月份誇耀説,得益於配備自研芯片的新型超級計算機,這家搜索引擎巨頭可以開發出與深求科技相媲美但成本更低的模型。華為也因其產品受到讚譽,這些產品旨在與NVIDIA的設備競爭,後者的圖形處理器(GPU)驅動着美國和歐洲最先進的AI模型。
中國科技正在迎頭趕上
Chatbot Arena上最佳AI模型的性能測量
來源:LMSYS,由斯坦福大學AI指數彙編
注:Chatbot Arena是一個基於人類偏好的AI評估開源平台,由LMArena的研究人員開發。
不久前,中國共產黨對一個他們認為失控的科技行業進行了限制。反壟斷調查和數據隱私合規審查啓動,阿里巴巴聯合創始人馬雲等巨頭從公眾視野消失,針對社交媒體、零工經濟和遊戲應用的新法規出台。現在,面對外國干預,中共正在推動本土科技產業的發展。習近平主席整合AI和半導體資源,加強中國高技能勞動力,並呼籲建立一個“獨立、可控、協作”的軟硬件生態系統。
具有諷刺意味的是,中國在人工智能領域的最新進展反而受到地緣政治壓力的推動,而這些壓力本意是遏制該國AI發展勢頭。Counterpoint Technology Market Research分析師孫偉表示,如今中美AI差距已從以年計算縮短至按月衡量。“中國擁有集體協作文化和高強度工作精神,這使其在執行層面形成優勢。“孫偉指出,英偉達芯片的強制短缺反而催生了新型AI創新。“這種態勢形成了一種達爾文式壓力:能夠以少博多的企業才能生存下來。”
在中國看到創新突破的地方,美國許多人仍堅持認為存在不當行為。美國眾議院兩黨特別委員會四月發佈的報告聲稱深度求索公司與中國政府存在"重大關聯”,並指控該公司非法竊取OpenAI數據,構成"對美國國家安全的重大威脅”。
Anthropic公司CEO達里奧·阿莫代呼籲加強美國出口管制,在其3400字的長篇博客中指控深度求索走私大量英偉達GPU——包括最先進的H100處理器。據彭博社最新報道,美國當局正在調查深度求索是否通過新加坡第三方採購禁運芯片來規避出口限制。
Anthropic公司CEO達里奧·阿莫代。圖片來源:Chesnot/Getty Images中國大使館駁斥了委員會的指控,稱其"毫無根據”。英偉達表示,DeepSeek的芯片符合出口規定。進一步的限制可能對中國半導體產業有利。據該芯片製造商的一位發言人透露,必須迫使DeepSeek使用更多來自中國的芯片和服務,這將增強華為和外國AI基礎設施供應商的實力。
處於這場辯論中心的公司仍然充滿謎團。DeepSeek以開源其AI技術為榮,但對其內部運作和意圖卻守口如瓶。在公開出版物中,雖然披露了其研究的高度具體細節,但沒有關於構建其AI的總成本、當前GPU配置或數據來源的基本信息。
長期以來,人們都知道梁本人非常不合羣,以至於中國AI界的一些領軍人物私下稱他為”科技狂人"——這個綽號是為那些野心過大的古怪企業家保留的變體。在過去十個月裏,他沒有接受過任何採訪。很少有人知道他的長相——直到最近在中國總理李強的聽證會上出現了一張他戴着眼鏡的年輕面孔的照片。梁和他的同事沒有回應本文多次提出的評論請求——除了一位員工自動回覆稱正在處理請求:“感謝您對DeepSeek的關注和支持!“她的郵件中寫道。
窺探黑匣子內部
為了更好地理解這家公司的運作方式及其如何融入國家整體人工智能戰略,彭博商業週刊採訪了梁的十一位前員工,以及三十多位中國AI行業的分析師、風險投資人和高管。
公開亮相的缺失讓阿莫迪和OpenAI首席執行官薩姆·奧爾特曼等批評者有機可乘,用誹謗填補這一真空。這些言論在美國受眾中引起共鳴,他們將中國技術視為威脅。
但即便是那些仍對深度求索持懷疑態度的人,也不得不正視其AI系統無可爭議的強大性能。Perplexity AI(類似聊天機器人的搜索引擎)的首席商務官德米特里·舍維連科表示,公司內部無人能與深度求索的同行建立有效溝通。儘管如此,Perplexity仍採用了深度求索的技術,但僅限部署在歐美服務器上,並通過後期訓練刪除了所有暗示中共審查的數據集。該公司將這項技術命名為"R1 1776”(暗指美國建國年份),舍維連科稱這是對自由的致敬。“我們不清楚深度求索的真實動機,“他説,“這就像個黑匣子。”
深度求索早已預見到其AI技術會在海外引發疑慮。在2024年3月英偉達開發者大會的虛擬演講中,該公司深度學習研究員陳德立闡述瞭如何"解耦"大語言模型的價值觀以適應不同社會。在一張簡潔的幻燈片裏,陳展示了一個用於調整聊天機器人倫理標準的原型系統,使用者只需輕點按鈕,就能設定賭博、安樂死、性工作、持槍、大麻及代孕等議題的合法性。“只需選擇符合需求的選項,就能獲得量身定製的價值觀模型,“陳解釋道。
在DeepSeek,尋找這種高效解決方案一直是文化常態。梁和朋友們在2000年代中期就讀於浙江大學,學習機器學習、信號處理、電氣工程等技術專業——他們似乎出於興趣(當然也為了賺錢)在全球金融危機期間開發了股票交易計算機程序。
畢業後,梁繼續獨立開發量化交易系統,並因此賺了一筆小財富,之後他與幾位大學同學在杭州合作,於2015年共同創立了公司High-Flyer Quant)。
DeepSeek的北京辦公室。照片:Peter Catterall/AFP/Getty Images早期的招聘廣告中,他們誇耀從谷歌和Facebook挖來頂尖人才,並尋找具有《生活大爆炸》中笨拙主角謝爾頓那種“古怪天才”的數學和編程“極客”。他們承諾提供免費零食、Herman Miller椅子、撲克之夜、歡迎T恤和拖鞋的辦公室文化,以及——帶着一絲金融科技兄弟文化的味道——與“90年代温柔迷人的女孩”和“從華爾街歸來的犀利女神”共事的機會。
和DeepSeek一樣,High-Flyer也習慣保持神秘——在首個社交媒體帖子中,梁僅被稱為“L先生”——同時承諾一種“讓我證明給你看”的透明度。每週五,High-Flyer會在微信上發佈其最初十隻基金的表現圖表。在2016年夏季改為僅向註冊投資者提供每週數據前,該投資組合實現了35%的平均年化收益率。
最終有數十億美元流入了High-Flyer的投資組合,這家投資研究集團的員工人數也增長到超過100人。梁在2019年開始大力招募人工智能部門的員工,以分析海量數據集,從而發現被低估的股票、高頻交易的微小价格波動以及行業投資者忽視的宏觀趨勢。
在新冠疫情初期,他和團隊搭建了一個由相互連接、並行運行的處理器組成的高性能計算系統,稱為集羣。據High-Flyer自稱,該集羣配備了1000塊Nvidia 2080Ti芯片(通常被遊戲玩家和3D藝術家使用)以及額外的100塊Volta系列GPU。(Volta GPU——也被稱為V100——是Nvidia首款專為人工智能優化的處理器。)此前High-Flyer較小的計算架構需要兩個月來訓練一個新的經濟分析模型,而新設備僅用不到四天就能完成相同的工作量。
痴迷於深度學習
這些金融模型令人印象深刻,但遠小於OpenAI等美國公司開發的通用模型。梁力主建造一個更大的超級計算機,採用當時Nvidia的新型A100 GPU——V100的升級版。一位參與該項目的前High-Flyer工程師表示,梁是這一不斷擴大的集羣的“最大個人用户”。他估計,用於模型開發的計算資源中有80%歸屬於梁的用户名。這位前工程師稱,梁似乎對深度學習“痴迷”,並稱之為“他昂貴的愛好”。對於一家量化公司而言,投入數億美元建設這樣的人工智能基礎設施可能有些過度,但梁的盈利足以輕鬆承擔。“對當時的梁來説,這只是零花錢,”工程師回憶道,“更多的算力,更好的模型,交易中更多的利潤。”
至少這是當初的希望。高飛公司——當時管理着約141億美元的資產——在2021年12月給股東的信中為一系列令人失望的回報道歉。該公司將其歸咎於人工智能系統,認為這些系統雖然能做出聰明的股票選擇,但在疫情期間的市場波動中無法準確判斷退出這些交易的時機。
儘管如此,該公司仍決定在字面意義上加倍投入AI:2022年1月,高飛在社交媒體上宣佈採購了5000塊英偉達A100芯片,每塊通常價值數萬美元。同年3月又宣佈將集羣規模擴大至1萬塊——僅六個月後英偉達就警告稱,美國新出口限制可能影響此類芯片對華銷售。
尚不清楚這些基礎設施最終有多少用於量化交易,又有多少投入了梁的昂貴愛好。次年春天——即OpenAI推出ChatGPT約五個月後——他將深度求索拆分成為獨立研究實驗室。位於杭州和北京的獨立辦公室裏,金融業不再是焦點。在一份滿是陳詞濫調的未署名宣言中,高飛宣稱要拒絕平庸,直面AI革命中最艱鉅的挑戰。終極目標是:人工通用智能(AGI)。
本報道是2025年6月刊《彭博商業週刊》的一部分。插圖:7312023年全年,深度求索實驗室全力開發了一款AI代碼助手、一個具備常識的聊天機器人以及一個文本轉3D藝術生成器。梁從高飛公司挖來工程師,並從微軟北京分部以及中國頂尖科技企業和高校招募了更多人才。同年9月以學生身份加入深度求索的劉博(Benjamin),在開始攻讀博士學位前表示,梁經常將重要任務交給實習生,而這些任務在其他地方只會分配給經驗豐富的員工。“以我為例:我剛加入公司時,沒人負責RLHF基礎設施”——即支持名為人類反饋強化學習的關鍵技術所需的基礎架構——“他就直接讓我負責了”,劉説。“他相信你能完成前人未竟之事。"(這種信任為深度求索帶來了額外優勢:實習生每日津貼摺合140美元,每月還有420美元住房補貼。雖然按中國標準算豐厚報酬,但這僅為美國AI企業實習生收入的三分之一,更是硅谷全職工程師薪資的零頭。)
梁很早就押注於稀疏性,兩位前深度求索研究員表示。這是一種通過將大語言模型劃分為專業領域來提高訓練和運行效率的技術。如果向最初的ChatGPT提問,它會激活整個大語言模型大腦來尋找理想答案——無論問題是2+2的和還是蛋糕食譜。而稀疏模型則通過劃分為"專家"來更好地利用資源,只有相關的專家會針對特定輸入被激活。
採用稀疏方法可以大幅節省計算成本,但會變得極其複雜。如果問題沒有被足夠多的腦回路處理或發送到錯誤的大腦區域,回答質量就會下降。(數學大腦可能知道如何在公式中使用圓周率π,但不知道蛋糕食譜裏該放什麼。)梁觀察到谷歌和法國獨角獸公司Mistral在該領域取得的進展,後者於2023年12月發佈了一個稀疏模型。該模型被劃分為八個專家,每個查詢會根據上下文激活兩個最相關的專家。他號召團隊設計具有越來越多專家的模型——這種技術可能增加幻覺風險並導致AI知識碎片化。“這引發了激烈的內部爭論”,前深度求索員工表示。
隨後又取得了一系列突破,這些成果均被公開宣佈,並逐漸引起了中國競爭對手的關注。2024年底,DeepSeek發佈了V3——這是一個通用AI模型,比當時最大的開源大語言模型Meta對應模型還要大約65%。但真正吸引谷歌、OpenAI和微軟高層注意的,是DeepSeek在推出R1推理模型前一個月發佈的關於V3的詳盡研究論文。
該PDF文件中披露了一個令人驚訝的數據:DeepSeek暗示V3的整個開發僅花費了560萬美元(500萬歐元)。這個數字可能僅指最後的訓練階段——一個將模型原型轉化為成品的精煉過程。但許多人認為這對整個項目來説是個低得離譜的預算。作為對比,最先進的開創性模型的累計訓練成本可能高達1億美元甚至更多。Anthropic的Amodei甚至預測(在DeepSeek崛起之前),下一代模型的訓練成本將分別在100億到1000億美元之間。
熱門AI平台Hugging Face的研究主管Leandro von Werra(該平台發佈大語言模型排名)表示,DeepSeek的"架構創新"並非該模型最引人注目之處。研究論文最重要的啓示是,該公司必定開發了高質量數據——無論是巧妙地從互聯網提取還是通過其他方式獲取——才讓V3得以誕生。“沒有非常強大的數據集,模型就會缺乏性能,“von Werra説,“報告清楚地表明,DeepSeek擁有目前最好的大語言模型訓練數據集之一。遺憾的是,這份50頁的論文只用半頁篇幅討論了數據集。”
DeepSeek之所以能取得如此快速的進展,是因為梁將開源思想視為其哲學理念的核心部分。他認為,像OpenAI和谷歌這樣的美國領先實驗室所採取的做法——隱藏專有技術並對強大模型收費——是在短期利益與更可持續的成功之間選擇了前者。
對DeepSeek來説,將其模型完全且基本免費地向公眾開放,是加速接受度並促使初創企業和研究人員在其技術上構建的最有效途徑。他們希望通過這種方式推動產品使用和反饋的積極發展。正如DeepSeek近兩年前在首次公開發布其大語言模型時所寫,並引用了開源操作系統Linux的創始人林納斯·託瓦茲的話:“空談無益,給我看代碼。”
AI龍
在四月一個陰雲密佈的週日,杭州繁忙的蕭山國際機場裏,阿里巴巴、字節跳動和華為的AI服務數字廣告牌迎接着旅客。一個藍髮人形機器人在現代化的航站樓內向乘客揮手。外面,一家自動駕駛初創公司正在測試用於貨運的無人駕駛卡車。在DeepSeek引發的所有喧囂中,西方人似乎忘記了它只是中國眾多“硅谷”中崛起的眾多“AI龍”之一。僅在擁有1250萬人口的超大城市杭州,DeepSeek就屬於被稱為“六小龍”的精英科技初創企業之一。
在風景如畫的西湖區坐落着*遊戲科學——這家熱門工作室正是現象級動作遊戲《黑神話:悟空》*的締造者,該遊戲以運用機器學習技術打造栩栩如生的數字角色而聞名。不遠處盤踞着兩家機器人巨頭和一家專注於三維空間軟件的獨角獸企業。同屬這片區域的還有浙江強腦科技(以BrainCo之名廣為人知),堪稱中國版Neuralink。這家脱胎於哈佛大學中國籍博士生韓璧丞初創項目的企業,如今正在杭州合作實驗室研發仿生肢體與腦機交互技術。BrainCo研發的一款AI仿生手,目前正陳列於中國人工智能小鎮展覽中心——這是杭州另一個蓬勃發展的科技地標。
據活動參與者透露,近幾周BrainCo高管親自擔任展覽講解員。參觀者多為投資意向人士,但這些科技精英似乎並不急於尋求外部資金。“他們本質上並不缺錢,“一位參與導覽的基金經理表示,“隨着六小龍概念的熱炒,資本正追着他們投資。”
所有這些初創企業的背後都有習近平主席領導的政府支持。生成式人工智能、機器人技術和其他高科技雄心正在推動一項國家議程,其核心目標是實現國內"自立自強”——正如新華社報道中習近平在政治局會議上所強調:“我們必須認清差距、加倍努力,全面推動科技創新、產業升級和人工智能應用。”
這些"龍"正在傾聽,而且並非都是小魚小蝦。市值3000億美元的阿里巴巴集團總部坐落於杭州西郊,距離西湖約40分鐘車程,園區內湖光山色自成天地。該企業近期承諾未來三年將投入530億美元建設人工智能數據中心,並宣稱其最新旗艦模型Qwen3在性能與成本效益上可與深度求索(DeepSeek)比肩。
在國際視野中,阿里巴巴常被視為電商巨頭,但其增長更迅猛的人工智能與雲計算業務已於2022年遷至杭州近郊獨立園區。會議室裏的大型屏幕即時刷新着"行業洞察快報”",每72小時更新競品動態,深度解析深度求索與OpenAI等對手的最新突破。就連洗手間都設有每週更新的戰報,提醒人們即便在生理需求時刻,這場人工智能競賽也從未停歇。
今年四月,消失近五年的阿里巴巴聯合創始人馬雲——這位在中國共產黨整頓科技行業期間幾乎銷聲匿跡的傳奇人物——突然現身公司園區,慶祝阿里雲成立15週年。據多名與會者透露,馬雲在這場罕見的演講中強調,希望人工智能服務人類而非統治人類。通過香港和東京辦公室觀看直播的參與者表示,他們對馬雲的高調復出感到振奮。
這一事件表明,像馬雲這樣的科技巨星顯然重新獲得了中共的青睞——梁博士等新鋭人才也正加入他們的行列——而美國科技領袖的光環正在褪色。中國的民族自豪感與日俱增,這個國家迫切希望證明能夠突破西方設置的障礙。
失去魅力的硅谷
亞洲集團有限責任公司駐香港董事總經理喬治·陳指出,曾就職於蘋果、谷歌、微軟等美國頂尖企業的中國頂尖工程師已開始迴流。雖然部分原因是特朗普政府的敵意政策,但他們也被東方崛起的發展機遇所吸引。“硅谷對中國人才已不再具有職場吸引力”,陳表示。
另一家中國獨角獸企業01.AI創始人李開復更進一步。這位曾任職蘋果、谷歌和微軟的行業老兵認為,新一代人才不會重走他的老路——先在美國企業工作再回國創業。“這些年輕AI工程師大多在國內接受培養”,他解釋道,“深度求索等新興AI初創企業的成功,正激勵更多年輕人才投身中國AI復興浪潮。”
梁(中)二月份在北京某研討會現場。攝影:Florence Lo/路透社當今中國沒有哪家科技企業能像深度求索這般激發民族自豪感。四月,27歲的加拿大計算機科學家柯比·馮攜家人造訪杭州時,特意帶他們參觀了梁的母校浙江大學。馮曾參與該校交換項目,他想向祖父母和弟弟證明自己與梁同校就讀。“能告訴加拿大的朋友深度求索創始人是我校友,這感覺太棒了,“馮説道。
遊客和網紅們定期湧向深度求索總部——四座塔樓組成的建築羣俯瞰着著名的京杭大運河。人們常在周邊商鋪尋覓梁的蹤跡,包括總部大樓內員工偶爾光顧的高檔火鍋店。(店員不得不遺憾告知:他從未現身。)
知情人士透露,梁往返於杭州和北京辦公室之間。後者位於科技園玻璃大廈五層,二十多歲的程序員們在可升降辦公桌前工作,茶水間堆滿能量飲料、康師傅泡麪和辣條。白板上寫着員工加餐需求。“在那兒吃了幾個月午晚餐,我都胖了,“一位離職研究員坦言。
全息影像CEO
梁很少同意與外界會面,有時僅以全息投影形式接待少數訪客。今年他甚至婉拒了巴黎極具影響力的AI行動峯會邀請——這場活動彙集了OpenAI首席執行官阿爾特曼、Alphabet與谷歌CEO桑達爾·皮查伊以及多位國家元首。
當中國為深度求索歡呼時,卻將美國視為供水系統中神秘出現的未知有機體,不斷檢測其屬於良性還是惡性。
批評者指控深度求索受中共操控,竊取美國競爭對手的訓練數據,並參與旨在顛覆硅谷AI霸主地位的大型間諜活動或心理戰。“深度求索是美國科技界與中共監控國家的直連通道,不僅威脅美國公民隱私,更危害國家安全,“某調查深度求索的美國眾議院委員會發言人表示。
但深度求索將自己包裝成普通初創企業——其二月在X平台的推文甚至戲仿美國科技公司"車庫創業"的神話。畢竟這家公司北京總部與谷歌同處一個園區,距離漢堡王和兩家提姆霍頓咖啡店僅咫尺之遙。
僅僅因為AI行業此前對深度求索(DeepSeek)關注甚少,並不意味着幕後存在什麼可疑活動。“AI界沒有預料到深度求索的崛起,“風險投資公司Alpha Intelligence Capital(投資了OpenAI和商湯科技)的合夥人阿爾諾·巴泰勒米表示,“但他們本該預見。”
巴泰勒米指出,深度求索帶來的真正啓示在於:中國科技企業如何高效地將運營限制轉化為競爭優勢。“中國有許多聰明人才,他們用低得多的算力需求催生了大量智能創新。”
實際上,英偉達CEO黃仁勳在2023年5月——恰逢深度求索成立的同月——向《商業週刊》表示:《商業週刊》,美國對中國的過度監管只會激勵這個國家用創新碾壓阻礙者。黃仁勳認為經濟影響力是國家安全的有效工具,但政府幹預的意外後果將非常嚴重。“失去科技行業三分之一的市場必然是災難性的,“他在談及限制對華技術出口的風險時説,“沒有競爭壓力,他們將蓬勃發展。他們會茁壯成長,然後把產品出口到歐洲和東南亞。”
英偉達CEO黃仁勳。圖片來源:David Paul Morris/BloombergDeepSeek發展歷程中仍存在一個關鍵爭議點:該公司實際投入了多少資金用於模型?
美國研究機構SemiAnalysis在一份被廣泛引用的報告中估算,High-Flyer與DeepSeek可能秘密使用了約5萬塊價值14億美元的英偉達H系列頂級GPU集羣,其中大部分未對外公開。該機構表示,這些基礎設施主要由符合出口管制政策的GPU組成(美國政府允許英偉達向中國出售經過性能限制改造的H20和H800芯片)。但報告同時聲稱,DeepSeek還額外獲取了1萬塊被美國政府禁售的尖端H100芯片。
三位前員工強烈反駁這一説法,稱DeepSeek實際擁有的GPU數量不足2萬塊,且多為英偉達舊款芯片和受管制芯片。“他們在散佈謊言”,博士生劉博如此評價SemiAnalysis的報告。該機構則堅持其調查結論。
無可爭議的是,DeepSeek渴望獲得美國科技公司同等級別的算力資源。該公司自信若能獲得同等條件,其成就可以遠超硅谷。“現實情況是,大語言模型研究者對算力資源有着巨大需求——如果我擁有數萬塊H系列GPU,可能也會奢侈地開展大量非必要實驗”,一位前DeepSeek員工坦言。
然而,獲取更多資源是中國科技行業迫切希望解決的問題。“我希望有一天我們中國企業能擁有5萬塊GPU,“這位已轉投北京另一家開源AI實驗室的前研究員説道,“您想看看我們能實現什麼嗎?”
—— 奧斯汀·卡爾*、薩里塔·拉伊與黃哲平,呂斯丁、車克萊爾、馬特·戴及傑基·達瓦洛斯聯合報道*
原文標題:深度求索的"科技狂人"正威脅美國在AI領域的主導地位