財經人語:顛覆人工智能界 DeepSeek是何方神聖? | 聯合早報
zaobao
中國人工智能初創公司深度求索(DeepSeek)不僅轟動美國硅谷,更在星期一(1月27日)讓華爾街股市掀起大海嘯,引發科技股大暴跌,而晶片巨頭英偉達(Nvidia)股價當天潰敗,猛跌17%至118.58美元,市值一夜蒸發近6000億美元(約8072億新元)。
市場投資者對人工智能泡沫破滅的擔憂,導致納斯達克綜合指數在這一天下挫3.07%。整個股市對DeepSeek的反應,引發投資者對過度炒作的人工智能投資週期的懷疑,也不禁開始質疑人工智能鉅額投資的效率。
晶片巨頭英偉達股價星期一(1月27日)潰敗,猛跌17%至118.58美元,市值一夜蒸發近6000億美元(約8072億新元)。(法新社)
DeepSeek最讓市場大跌眼鏡的是,它能夠在無需花費同等費用的情況下,構建一個類似OpenAI的ChatGPT。DeepSeek公開它大概需要花費560萬美元,來構建它的人工智能模型。
而人工智能開發商Anthropic首席執行官阿莫代(Dario Amodei)去年提到的構建模型成本則是在1億美元至10億美元之間。美國的各個大型科技公司每年花費數百億美元的資本支出,大部分也是專門用在人工智能基礎設施上。
成本的差距令人震驚。
延伸閲讀
[中國AI“DeepSeek”人氣超越ChatGPT
](https://www.bdggg.com/2025/zaobao/news_2025_01_28_736032)
中國DeepSeek發佈低價大模型 性能比肩OpenAI o1
誰是梁文鋒?
到底DeepSeek是怎樣的一家公司?它的創始人梁文鋒又是誰?
梁文鋒原本是中國量化對沖基金的創始人。約兩年前,他決定投身人工智能領域。當時他拿着1萬塊英偉達(Nvidia)晶片,組建了一支年輕、雄心勃勃的人才團隊。
兩年後的今天,DeepSeek爆紅了。
DeepSeek是在1月20日發佈了一個開源人工智能模型,而且免費供人使用。這個模型迅速成為硅谷的熱門話題。
DeepSeek-R1在多項數學和推理基準測試中,都擊敗了OpenAI o1等業界領先的人工智能模型。不論在能力、成本、開放性等各個指標,DeepSeek都在挑戰着西方人工智能巨頭。
若把這次DeepSeek的成功形容為人工智能的黑天鵝事件,其實一點也不為過。
在中美科技冷戰期間,美國對出口的嚴厲管制,嚴重地限制了中國科技公司利用“西方的科技”在人工智能領域競爭的能力。這些中國科技公司無法通過購買更多高科技晶片,來培訓無限擴大的人工智能模型。基於此,許多中國人工智能相關企業都只能專注在下游應用,而不是建立自己的人工智能模型。
其實DeepSeek在中國人工智能行業,是個非常另類的人工智能初創公司。它最初是中國表現最好的量化對沖基金之一,也就是High-Flyer的深度學習研究分支,名為Fire-Flyer。
這個對沖基金成立於2015年,並迅速在中國聲名鵲起,成為首支募集資金超過1000億元人民幣(約185億5600萬新元)的量化對沖基金。不過自2021年以來,這個數字已降至80億美元(約107億5400萬新元)左右。
多年來,High-Flyer一直在儲備圖形處理器(Graphics Processing Unit,簡稱GPU)並構建Fire-Flyer超級電腦來分析財務數據。然後,在2023年,也擁有電腦科學碩士學位的創辦人梁文鋒決定將基金的資源投入一家名為DeepSeek的新公司,開發自己的人工智能模型。
他大膽的願景奏效了。
梁文鋒去年曾向中國媒體説過,他轉換跑道的決定是出於對科學的好奇心,而不是渴望盈利。
他説,即使你要我找,我也找不到創建DeepSeek的商業理由。因為從商業的角度,這不值得做,基礎科學研究的投資回報率很低。當OpenAI的早期投資者給它錢時,他們肯定也沒有考慮自己會獲得多少回報。相反的,他們是真的很想做這件事。
就是這股“想做”的衝勁,今天的DeepSeek不僅能脱穎而出,而且還是中國唯一一家不依賴百度、阿里巴巴或字節跳動等科技巨頭融資的領先人工智能公司之一。其獨立性,不言而喻。
公司最初只有1萬塊英偉達H100晶片
美國政府是在2022年10月開始對高科技晶片實施出口管制,嚴格限制中國人工智能公司獲得像英偉達H100等尖端晶片。梁文鋒向媒體承認,這確實給DeepSeek帶來了問題。雖然該公司一開始儲備了1萬塊英偉達H100晶片,但是它需要更多的晶片才能與OpenAI和Meta Platforms等公司競爭。
因此,DeepSeek必須想出更有效的方法,來訓練它的人工智能模型。
他們使用一系列工程技巧優化了模型架構,如:晶片之間的通信方案、減少字段以節省內存,以及創新地使用模型混合方法等。其中許多方法都不是什麼新做法,但是把這些工程技巧結合在一起,它產生的尖端模型竟是了不起的。
一直為美國總統特朗普提供建議的硅谷風險投資家安德森(Marc Andreessen)於上星期五(24日)在社交平台X發佈貼文説:“Deepseek-R1是我見過最驚人、最令人印象深刻的突破之一。”
DeepSeek最後最重要的一步,就是它願意免費與公眾分享這些創新,因此它迅速在全球人工智能研究界贏得了相當大的好感。
對美國晶片出口管制帶來挫折
當然DeepSeek的突然冒起,也會給美國目前專門對準人工智能資源的出口管制帶來挫折。因為現在中國人工智能的發展已經不受限於高端晶片的多寡了。
DeepSeek已經顛覆了這方面的認知。
認知被顛覆,造成不安與驚慌是正常的。很明顯的是,整個華爾街也接受不了DeepSeek的突然成功。
DeepSeek的成功對原本被追捧的晶片巨頭英偉達(Nvidia)、超微(Advanced Micro Devices)、博通公司(Broadcom Inc)、Marvell Technology Inc等到底意味着什麼?
這些公司的市值應該是反映它們未來幾年由人工智能驅動的業績。但是現在按這種理解還合理嗎?這些科技巨頭對人工智能的高額資本支出還是正確的嗎?
肯定的是,DeepSeek的出現,將促使美國超大規模科技企業更迫切地要利用它們的關鍵優勢,也就是它們擁有的高端科技晶片,來擴大他們與DeepSeek的距離。
也許從這點來看,這些美國科技巨頭今後可能會更需要像英偉達和博通公司的晶片。
從更大的角度來看,這場中美科技冷戰現在已經不是一面倒。
美國總統特朗普是否會加速之前宣佈的Stargate數據中心發展計劃?是否能更快地拉到各個大巨頭至少投資5000億美元在Stargate?
DeepSeek的出現,也許會連原本對Stargate有意見的全球首富馬斯克(Elon Musk)也改變初衷。