CON O 深度搜索是什麼,為什麼它正在革新人工智能行業? | 路透社
Eduardo Baptista
北京,1月27日(路透社) - 中國初創公司DeepSeek推出的新型人工智能模型聲稱與美國行業領導者相當或更好,且成本僅為其一小部分,這威脅到全球技術秩序的改變。
該公司在全球人工智能圈內引起關注,因其在上個月的一篇文章中提到,DeepSeek-V3的訓練所需的Nvidia H800芯片計算能力不到600萬美元。
基於DeepSeek-V3的DeepSeek人工智能助手已超越其競爭對手ChatGPT,成為美國蘋果App Store上評分最高的免費應用。
這一事件引發了對一些美國科技公司投入數十億美元進行人工智能投資的決策依據的質疑,包括Nvidia在內的多家公司的股票受到影響。
以下是一些關於這家正在全球範圍內震撼人工智能行業的公司的數據。
為什麼DeepSeek引起了轟動?
OpenAI在2022年底推出的ChatGPT在中國科技公司中引發了轟動,許多公司急於創建自己的基於人工智能的聊天機器人。
然而,在中國搜索引擎巨頭百度推出首箇中國版ChatGPT後,普遍對中美企業在人工智能能力上的差距感到失望。DeepSeek模型的質量和盈利能力改變了敍事。根據中國公司的説法,DeepSeek-V3和DeepSeek-R1這兩個模型受到了硅谷高管和美國科技公司工程師的讚譽,已與OpenAI和Meta的最先進模型相媲美。
此外,它們的使用成本更低。上週發佈的DeepSeek-R1的使用成本比OpenAI的o1模型便宜20到50倍,具體取決於任務,DeepSeek在其官方微信賬號的帖子中提到。
然而,一些人公開表達了對DeepSeek成功的懷疑。
Scale AI的首席執行官Alexandr Wang在週四接受CNBC採訪時表示,DeepSeek擁有50,000個Nvidia H100芯片,但沒有提供證據,並稱這些信息不會被披露,因為這將違反華盛頓的出口管制,禁止將如此先進的AI芯片出售給中國公司。
DeepSeek沒有立即回應關於這一指控的評論請求。
Bernstein的分析師在週一的研究報告中指出,DeepSeek V3模型的總訓練成本尚不清楚,但遠高於這家初創公司所稱的558萬美元的計算能力支出。
他們補充説,備受讚譽的R1模型的訓練成本也沒有被披露。
誰在DeepSeek背後?
DeepSeek是一家總部位於杭州的初創公司,其主要股東是量化對沖基金High-Flyer的聯合創始人梁文峯,根據中國的公司註冊記錄。
梁基金在2023年3月在其官方微信賬號上宣佈正在“重新開始”,超越商業,集中資源創建一個“新的獨立研究小組,以探索AGI(通用人工智能)的本質”。DeepSeek就是在同年成立的。
ChatGPT的創造者OpenAI將AGI定義為在大多數經濟上有價值的任務中超越人類的自主系統。
High-Flyer在DeepSeek上的投資金額尚不清楚,該公司在同一棟大樓內設有辦公室。根據中國的企業記錄,該公司還擁有與用於訓練AI模型的芯片集羣相關的專利。
High-Flyer的AI部門在2022年7月在其官方微信賬號上表示,擁有並運營一個由10,000個A100芯片組成的集羣。
北京對DeepSeek的看法是什麼?
DeepSeek的成功已經在中國的高層政治圈中顯現出來。根據新華社的報道,在DeepSeek-R1於1月20日公開的當天,其創始人梁出席了由中國總理李強組織的企業家和專家閉門研討會。
梁在會議上的出現可能是DeepSeek的成功對北京在超越華盛頓的出口管制和實現戰略性行業如AI的自給自足的政治目標的重要性的一種信號。
去年舉行的類似研討會上,百度的首席執行官李彥宏也出席了。
- 建議主題:
- 商業