DeepSeek讓整個硅谷坐立不安! 美國芯片圍堵中國AI政策或破產_風聞

橙哥迷妹-54分钟前

2025-01-28

轉自“冰汝看美國”

美國時間1月28日週一早盤，美國科技股一片哀嚎，人工智能芯片領先供應商英偉達股價直接暴跌 12%。此外，Meta和谷歌母公司 Alphabet，英偉達的競爭對手 Marvell、還有博通、美光和台積電也均大幅下跌。

造成美國股市哀鴻遍野的原因，是一款來自東方的"神秘AI應用"：DeepSeek。這款來自中國的AI產品，登頂了美國蘋果地區的免費下載榜，一舉超越了AI巨頭ChatGPT！一時間，硅谷的所有從業者，紛紛坐立不安…

DeepSeek打破了美國AI壟斷

DeepSeek是一家來自中國的開發開源大型語言模型的人工智能公司，總部位於浙江杭州。DeepSeek作為開源的大型語言AI模型，在最新發布的DeepSeek- R模型中，在僅有極少數標註數據的情況下，極大提升了模型的推理能力。

目前在數學、代碼、自然語言推理，以及科學領域的測試中，性能比肩目前行業的領頭羊，OpenAI O1的正式版。這一結果不僅震驚了整個硅谷，更是讓美國政府苦心經營的限制中國AI的策略落空。

從2022年的拜登政府，到如今的特朗普2.0，為了構建美國AI科技領先的護城河，美國政府先後三次出台芯片法案，切斷了中國獲得美國強大芯片的渠道，試圖限制中國AI技術的發展。例如英偉達公司的GPU H100型號，原本被認為是構建AI模型競爭力的關鍵產品，被禁止出口中國。但隨着DeepSeek的發佈被徹底顛覆，美國在AI上進行的芯片封鎖“政策破產”。

青出於藍

在很多AI基準測試結果與Open AI不相上下的情況下，DeepSeek僅僅花費了560萬美元，就完成了R1模型的訓練，這讓硅谷的各家公司相當震驚。要知道，行業領頭羊OpenAI每年的投入是50億美元，而背後的金主微軟則是投入了130億美元，谷歌在2024年度的報表中，更是豪擲了驚人的510億美元！

DeepSeek可能是對美國股市的最大威脅，因為該模型引發了對數千億美元資本支出的效用的質疑。“如果訓練模型變得更便宜、更快、更容易，那麼對使用AI的需求將增長和加速得更快，這確保了計算的供應將被使用。這也就有了開篇美國科技硬件和AI公司股票集體暴跌的一幕。

所以，DeepSeek是如何做到如此小的預算達成如此高的成就呢？這主要願意DeepSeek的工程師們，利用強大的開源模型，讓開發者們跳過了自行構建和訓練模型。只需要在現有模型的基礎上，進行自己模型的構建。行業內部的詞彙是“蒸餾”：即利用一個非常大的模型，來幫助你訓練小模型，並在特定任務上表現更出色。

對此，OpenAI的創始人薩姆·奧特曼發文表示：“複製已有有效的事物相對容易，但在不確定任何前景的情況下，但嘗試新事物、冒險和挑戰則是極其困難的。”話裏話外，奧特曼對於突然殺出來DeepSeek這個對手相當不爽。

其實，在AI領域中，所有的公司都是靠着互相模仿起家：Google建立了第一批大型語言模型，但是並未將其作為第一優先級，ChatGPT看到了機會後，抄襲了Google的想法迅速進入這一領域。而當ChatGPT成為行業領頭羊時，谷歌，亞馬遜和Meta等公司紛紛入局，

同樣，DeepSeek也對於自己的來源沒有藏着掖着，當對DeepSeek提問你是什麼型號時，DeepSeek會直接回答説，我是由OpenAI所創建的人工智能，架構則是基於ChatGPT-4。不過，這絕非是簡單的“站在巨人肩膀上”，而是青出於藍而勝於藍的故事。如今的DeepSeek，不僅是簡單的模仿，而是通過創新進行彎道超車。

DeepSeek與ChatGPT 最大的不同在於：DeepSeek R1是開源的，而 ChatGPT是閉源的。開源意味着開發者有着完全的訪問權限，而一旦開源軟件趕上甚至超越閉源軟件，所有開發者都將會轉向開源軟件。

這就給Open AI這樣的行業領頭羊敲響了警鐘，今天你們還是領跑者，明天就有可能被迎頭趕上！

美國硅谷的CEO們讚歎不已

想知道自己做的到底怎麼樣，要聽聽對手對你的評價。面對DeepSeek的突然崛起，微軟CEO薩提亞・納德拉在瑞士達沃斯論壇上表示：“DeepSeek 的新模型令人印象深刻，尤其是在如何高效開發開源模型並進行推理計算方面。它的計算效率非常出色，我們應當非常、非常認真地對待來自中國的這些技術進展。”

AI科技初創公司Scale AI創始人亞歷山大·王（Alexandr Wang）同樣在達沃斯論壇上，他表示，過去十年來，美國可能一直在人工智能競賽中領先於中國，但DeepSeek的AI大模型發佈可能會“改變一切”，尤其是在開源領域。

Meta創始人馬克·扎克伯格在一檔播客節目中表示，DeepSeek的大模型非常先進。美國科技行業雖然暫時領先，但中國正在全力衝刺，兩者差距很小。而Meta已經成立了四個專門研究小組來研究量DeepSeek的工作原理並基於此來改進旗下大模型Llama。

小分隊1和2試圖搞清楚DeepSeek是如何降低訓練和運行成本的；

小分隊3負責研究DeepSeek可能使用了哪些數據來訓練模型；

小分隊4正在考慮基於DeepSeek模型的屬性重組Meta模型的新技術。

Meta的惶恐並不意外，畢竟，當部門裏一個高管的薪資就超過整個DeepSeek V3的訓練成本，而且這樣的高管還有幾十位，他們該如何向高層交代？

揭秘DeepSeek團隊

而DeepSeek能取得今天的成就，絕非一日之功，同樣是經歷了多年的努力和“孵化”。創始人梁文峯來自浙江大學，擁有信息與電子工程學系本科和碩士學位。從2008年起，他就開始帶領團隊使用機器學習等技術探索全自動量化交易。不過直到2023年7月，DeepSeek才算是正式成立，進軍通用人工智能領域，且至今也未對外進行融資。

面對如此神秘的公司，前OpenAI政策主管、如今Anthropic聯合創始人Jack Clark認為，DeepSeek僱用了“一批高深莫測的奇才”。不過，梁文峯在接受採訪時曾透露，這裏沒有什麼高深莫測的奇才，不過都是來自Top高校的畢業生、包括尚未畢業的博四、博五實習生，還有一些畢業不久的年輕人。

DeepSeek團隊最大的特點是名校、年輕，即使是團隊Leader級別，年紀也多在35歲以下。不到140人的團隊，工程師和研發人員幾乎都來自清華大學、北京大學、中山大學、北京郵電大學等國內頂尖高校。

作為AI公司的創始人，梁文峯也曾被問到關於錢夠不夠的問題：怎麼看待做量化同時做大量基礎研發，不燒錢嗎？對此他的回答是：一件激動人心的事，或許不能單純用錢衡量。就像家裏買鋼琴，一來買得起，二來是因為有一羣急於在上面彈奏樂曲的人。

中美之間的AI競爭剛剛開始

2011年，馬斯克在接受媒體採訪時，主持人問了他一個問題，如何看看待中國比亞迪？馬斯克聽完後，不僅哈哈大笑，隨後還反問道，你見過比亞迪的車輛嗎？我不認為比亞迪有什麼好的產品！時間推到2023年時，有網友把這段舊視頻翻出來後，馬斯克大方承認了自己當年的錯誤。他説，這是很多年前的事兒了，如今他們的汽車很具競爭力。

這樣的狀況，又一次出現在AI的領域中。一年半前，谷歌的前CEO埃裏克·施密特曾説過，中國的人工智能領域落後美國兩到三年。但到了本週ABC電視台《This Week》節目上，這位前CEO改了口“在過去的六個月裏，中國以驚人的速度迎頭趕上。”

喬治梅森大學（George Mason University）AI研究員迪恩·鮑爾（Dean Ball）認為，這一趨勢表明，中國開發團隊正在迅速接近前沿技術水平。他指出，DeepSeek的小型版本R1能夠在普通家庭電腦上運行，這將有助於推動AI應用的快速普及：“DeepSeek小型模型的卓越性能意味着強大的推理系統會迅速傳播，並能在本地硬件上運行——遠離任何集中監管（包括美國的出口管制）的視線。”

如今的美國，正計劃大舉砸錢投入AI基礎設施。就在上週，美國新任總統特朗普宣佈OpenAI、甲骨文、軟銀將成立一家合資企業“星際之門項目”，未來四年斥資5000億美元（約合人民幣3.6萬億元）建設新的AI數據中心。特朗普的人工智能“沙皇”薩克斯表示，DeepSeek“表明人工智能競賽將非常具有競爭力,美國人能自信但不能自滿。

中國AI公司證明了用有限的計算資源，足以做出頂尖水平的模型。DeepSeek R1正在改寫AI遊戲規則。隨着更多的中國AI公司通過開源和低價模型的進入，這場中美之間的AI競爭大戲，才剛剛開始…