DeepSeek是什麼,它為什麼會顛覆人工智能行業?| 路透社
Eduardo Baptista
Deepseek 標誌和中國國旗在2025年1月27日拍攝的插圖中可見。路透社/Dado Ruvic/插圖北京,1月27日(路透社)- 中國初創公司 DeepSeek 最新 AI 模型的發佈,聲稱其性能與美國行業領先模型相當或更好,且成本僅為其一小部分,這威脅到技術世界的秩序。
該公司在全球 AI 圈內引起關注,因為上個月在一篇論文中寫道,DeepSeek-V3 的訓練所需的計算能力不到600萬美元,使用的是 Nvidia H800 芯片。
DeepSeek 的 AI 助手,由 DeepSeek-V3 提供支持,已 超越 競爭對手 ChatGPT,成為美國蘋果應用商店中評分最高的免費應用。這引發了對一些美國科技公司承諾數十億美元 AI 投資背後理由的質疑,幾家大型科技公司的股票,包括 Nvidia,受到了影響。以下是一些關於這家正在全球範圍內震撼 AI 領域的公司的事實。
為什麼 DeepSeek 引起了轟動?
2022 年底 OpenAI 的 ChatGPT 發佈引發了 中國科技公司之間的爭搶,他們急於創建自己的人工智能聊天機器人。但在搜索引擎巨頭百度發佈第一個中國 ChatGPT 等效產品後(9888.HK),在中國對美國和中國公司之間的人工智能能力差距感到廣泛失望。DeepSeek的模型的質量和成本效率徹底改變了這一敍述。這兩款受到硅谷高管和美國科技公司工程師一致讚譽的模型,DeepSeek-V3和DeepSeek-R1,已與OpenAI和Meta的最先進模型相媲美,這家中國初創公司表示。
它們的使用成本也更低。根據DeepSeek官方微信賬號的一篇帖子,剛剛發佈的DeepSeek-R1的使用成本比OpenAI的o1模型便宜20到50倍,具體取決於任務。
但一些人公開對DeepSeek的成功故事表示懷疑。
Scale AI首席執行官Alexandr Wang在週四接受CNBC採訪時表示,DeepSeek擁有50,000個Nvidia H100芯片,但沒有提供證據,他聲稱這不會被披露,因為這將違反華盛頓的出口管制,禁止將此類先進的人工智能芯片出售給中國公司。DeepSeek沒有立即回應對此指控的評論請求。
伯恩斯坦分析師在週一的研究報告中指出,DeepSeek的V3模型的總訓練成本尚不清楚,但遠高於這家初創公司所稱的用於計算能力的558萬美元。分析師還表示,同樣備受讚譽的R1模型的訓練成本沒有披露。
DEEPSEEK背後是誰?
DeepSeek是一家總部位於杭州的初創公司,其控股股東是量化對沖基金High-Flyer的聯合創始人梁文峯,根據中國企業記錄。
梁的基金在2023年3月通過其官方微信賬號宣佈“重新開始”,超越交易,集中資源創建一個“新的獨立研究小組,以探索AGI的本質”(人工通用智能)。DeepSeek是在同年晚些時候成立的。
ChatGPT的製造商OpenAI將AGI定義為在大多數經濟價值任務中超越人類的自主系統。
目前尚不清楚High-Flyer在DeepSeek上投資了多少。根據中國企業記錄,High-Flyer的辦公室位於與DeepSeek同一棟大樓內,並且還擁有與用於訓練AI模型的芯片集羣相關的專利。
High-Flyer的AI部門在2022年7月通過其官方微信賬號表示,它擁有並運營一個由10,000個A100芯片組成的集羣。
北京如何看待DeepSeek?
DeepSeek的成功已經引起了中國最高政治圈的注意。根據國家新聞社新華社的報道,在DeepSeek-R1於1月20日向公眾發佈的當天,創始人梁出席了由中國總理李強主持的商界人士和專家的閉門座談會。
梁出席此次會議可能是DeepSeek的成功對北京克服華盛頓出口管制、實現戰略產業(如AI)自給自足的政策目標的重要性的一種跡象。
去年類似的座談會由百度首席執行官李彥宏出席。
路透社日報簡報提供您開始一天所需的所有新聞。請在 這裏註冊。
- 推薦主題:
- 中斷