DeepSeek讓整個硅谷坐立不安! 美國芯片圍堵中國AI政策或破產_風聞
橙哥迷妹-54分钟前
轉自“冰汝看美國”
美國時間1月28日週一早盤,美國科技股一片哀嚎,人工智能芯片領先供應商英偉達股價直接暴跌 12%。此外,Meta和 谷歌母公司 Alphabet,英偉達的競爭對手 Marvell、還有博通、美光和台積電也均大幅下跌。

造成美國股市哀鴻遍野的原因,是一款來自東方的"神秘AI應用":DeepSeek。這款來自中國的AI產品,登頂了美國蘋果地區的免費下載榜,一舉超越了AI巨頭ChatGPT!一時間,硅谷的所有從業者,紛紛坐立不安…

DeepSeek打破了美國AI壟斷
DeepSeek是一家來自中國的開發開源大型語言模型的人工智能公司,總部位於浙江杭州。DeepSeek作為開源的大型語言AI模型,在最新發布的DeepSeek- R模型中,在僅有極少數標註數據的情況下,極大提升了模型的推理能力。

目前在數學、代碼、自然語言推理,以及科學領域的測試中,性能比肩目前行業的領頭羊,OpenAI O1的正式版。這一結果不僅震驚了整個硅谷,更是讓美國政府苦心經營的限制中國AI的策略落空。
從2022年的拜登政府,到如今的特朗普2.0,為了構建美國AI科技領先的護城河,美國政府先後三次出台芯片法案,切斷了中國獲得美國強大芯片的渠道,試圖限制中國AI技術的發展。例如英偉達公司的GPU H100型號,原本被認為是構建AI模型競爭力的關鍵產品,被禁止出口中國。但隨着DeepSeek的發佈被徹底顛覆,美國在AI上進行的芯片封鎖“政策破產”。
青出於藍
在很多AI基準測試結果與Open AI不相上下的情況下,DeepSeek僅僅花費了560萬美元,就完成了R1模型的訓練,這讓硅谷的各家公司相當震驚。要知道,行業領頭羊OpenAI每年的投入是50億美元,而背後的金主微軟則是投入了130億美元,谷歌在2024年度的報表中,更是豪擲了驚人的510億美元!
DeepSeek可能是對美國股市的最大威脅,因為該模型引發了對數千億美元資本支出的效用的質疑。“如果訓練模型變得更便宜、更快、更容易,那麼對使用AI的需求將增長和加速得更快,這確保了計算的供應將被使用。這也就有了開篇美國科技硬件和AI公司股票集體暴跌的一幕。
所以,DeepSeek是如何做到如此小的預算達成如此高的成就呢?這主要願意DeepSeek的工程師們,利用強大的開源模型,讓開發者們跳過了自行構建和訓練模型。只需要在現有模型的基礎上,進行自己模型的構建。行業內部的詞彙是“蒸餾”:即利用一個非常大的模型,來幫助你訓練小模型,並在特定任務上表現更出色。
對此,OpenAI的創始人薩姆·奧特曼發文表示:“複製已有有效的事物相對容易,但在不確定任何前景的情況下,但嘗試新事物、冒險和挑戰則是極其困難的。”話裏話外,奧特曼對於突然殺出來DeepSeek這個對手相當不爽。

其實,在AI領域中,所有的公司都是靠着互相模仿起家:Google建立了第一批大型語言模型,但是並未將其作為第一優先級,ChatGPT看到了機會後,抄襲了Google的想法迅速進入這一領域。而當ChatGPT成為行業領頭羊時,谷歌,亞馬遜和Meta等公司紛紛入局,
同樣,DeepSeek也對於自己的來源沒有藏着掖着,當對DeepSeek提問你是什麼型號時,DeepSeek會直接回答説,我是由OpenAI所創建的人工智能,架構則是基於ChatGPT-4。不過,這絕非是簡單的“站在巨人肩膀上”,而是青出於藍而勝於藍的故事。如今的DeepSeek,不僅是簡單的模仿,而是通過創新進行彎道超車。
DeepSeek與ChatGPT 最大的不同在於:DeepSeek R1是開源的,而 ChatGPT是閉源的。開源意味着開發者有着完全的訪問權限,而一旦開源軟件趕上甚至超越閉源軟件,所有開發者都將會轉向開源軟件。
這就給Open AI這樣的行業領頭羊敲響了警鐘,今天你們還是領跑者,明天就有可能被迎頭趕上!
美國硅谷的CEO們讚歎不已
想知道自己做的到底怎麼樣,要聽聽對手對你的評價。面對DeepSeek的突然崛起,微軟CEO薩提亞・納德拉在瑞士達沃斯論壇上表示:“DeepSeek 的新模型令人印象深刻,尤其是在如何高效開發開源模型並進行推理計算方面。它的計算效率非常出色,我們應當非常、非常認真地對待來自中國的這些技術進展。”
AI科技初創公司Scale AI創始人亞歷山大·王(Alexandr Wang)同樣在達沃斯論壇上,他表示,過去十年來,美國可能一直在人工智能競賽中領先於中國,但DeepSeek的AI大模型發佈可能會“改變一切”,尤其是在開源領域。
Meta創始人馬克·扎克伯格在一檔播客節目中表示,DeepSeek的大模型非常先進。美國科技行業雖然暫時領先,但中國正在全力衝刺,兩者差距很小。而Meta已經成立了四個專門研究小組來研究量DeepSeek的工作原理並基於此來改進旗下大模型Llama。

小分隊1和2試圖搞清楚DeepSeek是如何降低訓練和運行成本的;
小分隊3負責研究DeepSeek可能使用了哪些數據來訓練模型;
小分隊4正在考慮基於DeepSeek模型的屬性重組Meta模型的新技術。
Meta的惶恐並不意外,畢竟,當部門裏一個高管的薪資就超過整個DeepSeek V3的訓練成本,而且這樣的高管還有幾十位,他們該如何向高層交代?
揭秘DeepSeek團隊
而DeepSeek能取得今天的成就,絕非一日之功,同樣是經歷了多年的努力和“孵化”。創始人梁文峯來自浙江大學,擁有信息與電子工程學系本科和碩士學位。從2008年起,他就開始帶領團隊使用機器學習等技術探索全自動量化交易。不過直到2023年7月,DeepSeek才算是正式成立,進軍通用人工智能領域,且至今也未對外進行融資。

面對如此神秘的公司,前OpenAI政策主管、如今Anthropic聯合創始人Jack Clark認為,DeepSeek僱用了“一批高深莫測的奇才”。不過,梁文峯在接受採訪時曾透露,這裏沒有什麼高深莫測的奇才,不過都是來自Top高校的畢業生、包括尚未畢業的博四、博五實習生,還有一些畢業不久的年輕人。
DeepSeek團隊最大的特點是名校、年輕,即使是團隊Leader級別,年紀也多在35歲以下。不到140人的團隊,工程師和研發人員幾乎都來自清華大學、北京大學、中山大學、北京郵電大學等國內頂尖高校。
作為AI公司的創始人,梁文峯也曾被問到關於錢夠不夠的問題:怎麼看待做量化同時做大量基礎研發,不燒錢嗎?對此他的回答是:一件激動人心的事,或許不能單純用錢衡量。就像家裏買鋼琴,一來買得起,二來是因為有一羣急於在上面彈奏樂曲的人。
中美之間的AI競爭剛剛開始
2011年,馬斯克在接受媒體採訪時,主持人問了他一個問題,如何看看待中國比亞迪?馬斯克聽完後,不僅哈哈大笑,隨後還反問道,你見過比亞迪的車輛嗎?我不認為比亞迪有什麼好的產品!時間推到2023年時,有網友把這段舊視頻翻出來後,馬斯克大方承認了自己當年的錯誤。他説,這是很多年前的事兒了,如今他們的汽車很具競爭力。
這樣的狀況,又一次出現在AI的領域中。一年半前,谷歌的前CEO埃裏克·施密特曾説過,中國的人工智能領域落後美國兩到三年。但到了本週ABC電視台《This Week》節目上,這位前CEO改了口“在過去的六個月裏,中國以驚人的速度迎頭趕上。”
喬治梅森大學(George Mason University)AI研究員迪恩·鮑爾 (Dean Ball)認為,這一趨勢表明,中國開發團隊正在迅速接近前沿技術水平。他指出,DeepSeek的小型版本R1能夠在普通家庭電腦上運行,這將有助於推動AI應用的快速普及:“DeepSeek小型模型的卓越性能意味着強大的推理系統會迅速傳播,並能在本地硬件上運行——遠離任何集中監管(包括美國的出口管制)的視線。”
如今的美國,正計劃大舉砸錢投入AI基礎設施。就在上週,美國新任總統特朗普宣佈OpenAI、甲骨文、軟銀將成立一家合資企業“星際之門項目”,未來四年斥資5000億美元(約合人民幣3.6萬億元)建設新的AI數據中心。特朗普的人工智能“沙皇”薩克斯表示,DeepSeek“表明人工智能競賽將非常具有競爭力,美國人能自信但不能自滿。

中國AI公司證明了用有限的計算資源,足以做出頂尖水平的模型。DeepSeek R1正在改寫AI遊戲規則。隨着更多的中國AI公司通過開源和低價模型的進入,這場中美之間的AI競爭大戲,才剛剛開始…