美國人工智能公司試圖揭露顛覆性DeepSeek的漏洞 | 路透社
Kenrick Cai,Anna Tong,Jeffrey Dastin
Deepseek 和 ChatGPT 應用圖標在2025年1月27日的插圖中可見。路透社/Dado Ruvic/插圖/檔案照片舊金山,1月28日 - 美國領先的人工智能公司的開發者們正在讚揚 DeepSeek 人工智能模型的崛起,同時也試圖揭穿其數十億美元技術被中國新興低成本替代品超越的説法。
中國初創公司 DeepSeek 週一引發了一場 股票拋售,其免費的人工智能助手 超越 OpenAI 的 ChatGPT,位居美國蘋果的 (AAPL.O) 應用商店之上,利用其聲稱在英偉達的 (NVDA.O) 低能力 H800 處理器芯片上訓練的模型,花費不到600萬美元。隨着對競爭的擔憂在美國股市中迴響,一些人工智能專家讚揚了 DeepSeek 強大的團隊和最新的研究,但對這一發展並未感到不安,四家領先人工智能實驗室的知情人士表示,他們因未獲授權而拒絕透露身份。
OpenAI 首席執行官 Sam Altman 在 X 上寫道,DeepSeek 最近幾周發佈的多個模型之一 R1 “是一個令人印象深刻的模型,特別是在他們能夠以這個價格提供的內容方面。”英偉達在一份 聲明 DeepSeek的成就證明了對其芯片需求的增加。軟件製造商Snowflake (SNOW.N) 在週一決定將DeepSeek模型添加到其AI模型市場,因收到大量客户諮詢。隨着員工也稱DeepSeek的模型為“驚人”,美國軟件銷售商在最終決定向客户提供之前,權衡了託管在中國開發的AI技術的潛在風險,Snowflake的產品執行副總裁Christian Kleinerman表示。
“我們決定只要對客户明確,我們就沒有支持它的問題,”他説。
與此同時,美國的AI開發者正在加緊分析DeepSeek的V3模型。DeepSeek在12月發佈了一篇伴隨該模型的研究論文,這是其熱門應用的基礎,但許多問題,例如總開發成本,在文件中沒有得到解答。
一位人士表示,中國現在已經從落後美國最先進AI模型18個月縮短到6個月。然而,隨着DeepSeek的免費發佈策略引發如此大的興奮,這家公司可能很快會發現自己沒有足夠的芯片來滿足需求,這位人士預測。
DeepSeek的進展並不僅僅源於600萬美元的緊縮預算,這與分析師估計美國大型雲公司今年在AI基礎設施上的支出2500億美元相比,微不足道。研究論文指出,這一成本特指其最終訓練運行中的芯片使用,而不是整個開發成本。
訓練運行只是總成本的冰山一角,兩家頂級實驗室的高管告訴路透社。他們表示,確定如何設計該訓練運行的成本可能要高出幾個數量級。
該論文指出,V3的訓練運行使用了2048個Nvidia的H800芯片,這些芯片是為了遵守2022年發佈的美國出口管制而設計的,專家告訴路透社,這些規則將幾乎不會減緩中國的人工智能進展。來自兩家人工智能實驗室的消息人士表示,他們預計早期開發階段依賴於更大量的芯片。其中一位人士表示,這樣的投資可能超過10億美元。
一些美國人工智能領導者讚揚DeepSeek決定將其模型作為開源發佈,這意味着其他公司或個人可以自由使用或修改它們。
風險投資家馬克·安德森在週日的X上發帖稱:“DeepSeek R1是我見過的最驚人和令人印象深刻的突破之一——作為開源,這是對世界的深刻饋贈。”
DeepSeek模型所獲得的讚譽凸顯了開源人工智能技術作為替代昂貴且嚴格控制的技術(如OpenAI的ChatGPT)的可行性,行業觀察人士表示。
華爾街最有價值的公司近年來因預期只有他們能夠獲得開發和擴展新興人工智能技術所需的龐大資本和計算能力而激增。這些假設將在本週和下週受到進一步審查,屆時許多美國科技巨頭將公佈季度財報。
路透社每日簡報通訊提供您開始一天所需的所有新聞。註冊 這裏。
- 建議主題:
- 中斷