DeepSeek將分享AI模型代碼，加倍對開源的投入 | 路透社

Reuters

2025-02-22

DeepSeek 的標誌 27/01/2025 路透社/Dado Ruvic/插圖/檔案北京，2月21日（路透社） - 中國初創公司 DeepSeek 週五宣佈，將向公眾提供其模型的代碼，重申其對開源人工智能的承諾。

該公司在社交媒體平台 X 上發佈消息稱，將在下週開放五個源代碼庫，稱這一舉措是“一個小而真誠的進步”，將以“完全透明”的方式分享。

“我們在線服務中的這些謙遜的構建塊已經在生產中進行了文檔記錄、部署和現場測試，”該發佈聲明稱。

上個月，DeepSeek 發佈了其開源推理模型 R1，震撼了全球人工智能行業，該模型在性能上與西方系統相媲美，並且開發成本更低。

該公司對開源的承諾使其與中國大多數人工智能公司區分開來，這些公司與美國的競爭對手一樣，傾向於封閉源代碼模型。DeepSeek 的低調創始人梁文峯在去年七月接受中國媒體的罕見採訪時表示，公司並未優先考慮其人工智能模型的商業化，並且開源可以獲得軟實力。

“讓其他人跟隨你的創新會帶來巨大的成就感，”梁在七月説。

“實際上，開源更多是一種文化行為而非商業行為，為此做出貢獻會讓我們贏得尊重，”他補充道。

新發布的開源代碼將提供基礎設施，以支持DeepSeek已經公開分享的AI模型，基於現有的開源代碼模型框架。

這一公告是在DeepSeek於週二發佈了一種名為原生稀疏注意力（NSA）的新算法之後，該算法旨在使長上下文的訓練和推理更加高效。

自上個月以來，DeepSeek的用户基礎激增。在中國，它是最受歡迎的聊天機器人服務，截至1月11日，活躍用户達2220萬，超過了豆瓣的1695萬用户，根據跟蹤AI產品的中國網站Aicpb.com的數據。

（報道：Liam Mo，Eduardo Baptista和Brenda Goh）

（翻譯：聖保羅編輯部）

路透社