美國的人工智能公司尋求反駁DeepSeek的聲明 | 路透社
Kenrick Cai,Anna Tong,Jeffrey Dastin
舊金山,1月28日 - 美國主要人工智能公司的開發者讚揚DeepSeek的人工智能模型,同時試圖反駁其技術價值數十億美元的觀點,認為它已被一家中國新興公司的低成本替代品超越。
週一,中國初創公司DeepSeek引發了一波股票拋售,其免費的人工智能助手在蘋果App Store中超越了OpenAI的ChatGPT(AAPL.O),這得益於其聲稱在Nvidia的H800處理器上訓練的模型(NVDA.O),該處理器的能力較低,成本不到600萬美元。儘管對競爭的擔憂在美國股市中迴響,但一些人工智能專家對DeepSeek強大的團隊和最新的研究表示讚賞,但對其出現保持冷靜,四家主要人工智能實驗室的知情人士表示,他們因未獲授權而拒絕透露身份。
OpenAI的首席執行官Sam Altman在X上寫道,DeepSeek在最近幾周推出的多個模型之一R1“是一個令人印象深刻的模型,尤其是考慮到他們能夠以這個價格提供的內容”。Nvidia在一份聲明中表示,DeepSeek的成就證明了對其更多芯片的需求。
軟件開發商Snowflake(SNOW.N) 在週一決定將DeepSeek的模型添加到其AI模型市場,因收到大量客户諮詢。儘管其員工也稱DeepSeek的模型為“驚人”,但這家美國軟件供應商在最終決定向客户提供之前,考慮了託管在中國開發的AI技術的潛在風險,Christian Kleinerman,Snowflake的執行副總裁解釋道。
“我們決定只要對客户保持透明,我們就不認為支持它有任何問題,”他説。
與此同時,美國的AI開發者們正急於分析DeepSeek的V3模型。去年12月,DeepSeek發佈了一份伴隨該模型的研究論文,這是其熱門應用的基礎,但其中並沒有回答許多問題,比如總開發成本。
據一位人士透露,中國在與美國開發的最先進AI模型的差距上已從18個月縮短至6個月。然而,DeepSeek的免費發佈策略引起了如此大的興趣,以至於該公司可能很快會面臨芯片不足以滿足需求的情況,這位人士預測。
DeepSeek的進展不僅僅歸功於600萬美元的預算,這與分析師估計美國大型雲公司今年在AI基礎設施上的支出2500億美元相比,微不足道。研究論文指出,這一成本特指其最終訓練測試中使用的芯片,而非總開發成本。
訓練過程在總成本方面只是冰山一角,兩家主要實驗室的高管對路透社表示。確定如何設計該訓練週期的成本可能要高得多。
文件稱,V3的訓練執行使用了2048個Nvidia的H800芯片,這些芯片是為了滿足2022年發佈的美國出口管制而設計的,專家對路透社表示,這些規定幾乎不會減緩中國人工智能的進展。
來自兩家人工智能實驗室的消息人士表示,他們預計開發的初期階段將基於更多的芯片。一位人士表示,這樣的投資可能超過10億美元。
一些美國人工智能領導者讚揚DeepSeek將其模型作為開源發佈的決定,這意味着其他公司或個人可以自由使用或修改它們。
風險投資家Marc Andreessen在X上的一篇帖子中表示:“DeepSeek R1是我見過的最驚人和令人印象深刻的進展之一,作為開源,它是對世界的深刻饋贈。”
DeepSeek模型的認可強調了開源人工智能技術作為替代昂貴且嚴格控制的技術(如OpenAI的ChatGPT)的可行性,行業觀察人士表示。
華爾街最有價值的公司在過去幾年中激增,因市場預期只有它們能夠獲得開發和擴展新興人工智能技術所需的鉅額資本和計算能力。這些假設將在本週和下週受到新的審查,屆時許多美國科技巨頭將公佈其季度業績。
- 建議主題:
- 技術