DeepSeek沒能讓算力焦慮消失,硅谷四巨頭全在加錢買算力_風聞
知危-知危官方账号-41分钟前
春節期間,國產大模型 DeepSeek-R1 橫空出世,證明了用更低的成本、更少的算力需求,就可以實現世界一流的模型性能水平。
R1 的出現似乎打破了大模型 “ 燒更多的錢買更強的芯片,換來更優性能產品 ” 的傳統路徑。1 月 27 日,英偉達股價單日下跌近 17% 。
不過,在人類通往 AGI 的路上,算力真的沒那麼重要了嗎?
谷歌、微軟、Meta和亞馬遜這硅谷四個科技巨頭可能並不這麼想。
從 1 月 30 日起至今,這四家公司接連發布了自己的財報,而在最新的財報中,他們都不約而同的提到:2025 年,要花更多的錢來佈局算力。
谷歌母公司 Alphabet 對 2025 年的資本開支目標為 750 億美元,相比 2024 年增加了 42%。谷歌表示,在 2024 年四季度,他們發現人們對 AI 產品有非常強勁的需求,以至於****需求超過了他們的可用容量。因此,他們將努力解決這一問題,確保他們有更多容量 —— 也就是花錢搞更多算力。
微軟則提到 2025 財年( 財年截至 6 月份 )將在人工智能數據中心上投入 800 億美元,原因也與谷歌相同 —— 市場需求持續高於他們的可用容量,需要擴充。
微軟還在電話會中表示,這樣的投入他們甚至還是保守了的,因為 “ 不能一次買太多,因為摩爾定律使硬件每年都會有性能提升,一下子買太多會虧,要把握好節奏。”
Meta 方面,2025 年的資本開支預算是 650 億美元,相較於 2024 年增長了 66%,扎克伯格表示:“ 我仍然認為,**從長遠來看,大力投資資本支出和基礎設施上將是一種戰略優勢。**也許我們會在某個時刻得出不同的結論,但現在還為時過早。此時此刻,我會賭注於,能夠構建出這種基礎設施將成為我們的一大優勢。”
亞馬遜則是在最新一季的電話會中提到 2025 年的資本開支將達到約 1000-1050 億美元,比去年的 830 億美元增加了 24%,亞馬遜首席財務官 Brian Olsavsky 在財報電話會上表示,這筆資本支出的 “ 絕大部分 ” 將用於AI和雲服務AWS。
四巨頭都在算力上繼續增加投入,並不是因為看不上 DeepSeek,反而是非常認同 DeepSeek。
亞馬遜首席執行官 Andy Jassy 表示,推理成本的減少,不意味着總支出會下降,“ 實際情況並非如此,我們在雲計算領域經歷過類似情形 ”。
而微軟的 CEO 此前也在 X 上發博轉發了維基百科的 “ 傑文斯悖論 ” 詞條來表示他的態度。

傑文斯悖論的核心邏輯是:技術提高資源使用效率後,可能會因人類行為的改變或市場反饋,導致總消耗量不降反升。
舉一個非常簡單的例子:隨着汽車技術的不斷提升,發動機的熱效率不斷提高,變得越來越省油,但由於效率提高使得用車成本降低,人們會買更多的車、開更遠的路,最後反而使得石油的消耗量變大。
同理,在 AI 世界裏,DeepSeek 就是那台效率更高的發動機,而算力就是汽油,單輛車的耗油量變低了,整個市場的汽油用量卻會增多。
要知道,DeepSeek-R1 雖然訓練成本低,但也是遵循 Scaling Law ( 規模擴展法則 )的。
在 Scaling Law 之下,我們可以簡單粗暴地把模型表現和算力需求看成一個 y=ax 的正相關函數,過去的模型的斜率 a 相對較小( 效率相對較低 ),模型表現雖然會隨着算力的加大而變得更好,但是增長較慢。DeepSeek 的斜率 a 則相對較大( 效率相對較高 ),模型表現隨算力加大而表現變得更好的速度會更快。
在這種情況下,你會因為效率更高而減少投入嗎?你大概率會因為效率更高而加大投入。
所以,與其擔心算力過剩,我們似乎更應該關心的是算力和效率我們都有,但是已經沒有優質數據可以用來訓練了。
同樣還是拿汽車來舉例子,當汽車的油耗( 模型效率 )和汽油( 算力 )都充沛的情況下,大家都買了車,最後卻發現出行速度沒辦法進一步提升了,因為路( 優質訓練數據 )不夠了,堵車了。
或許在未來,數據標註師會越來越少,世界會冒出來很多 “ 數據生產師 ”,他們每天坐在格子間裏,絞盡腦汁創造能提高模型性能的優質數據。