DeepSeek將分享其人工智能模型的部分代碼，加大對開源的投入 | 路透社

Reuters

2025-02-21

北京，2月21日（路透社） - 中國的DeepSeek宣佈將公開其模型的代碼，這家初創公司在週五重申了其對開源人工智能的承諾。

該公司在社交媒體平台X上發佈消息稱，將在下週開放5個源代碼庫，稱這一舉措是“微小但真誠的進展”，將“完全透明”地分享。

“這些我們在線服務的謙遜構建塊已經被記錄、部署並在生產中經過實戰測試，”該發佈稱。

DeepSeek上個月在全球人工智能行業引起轟動，當時它發佈了開源推理模型R1，該模型在性能上與西方系統相媲美，同時開發成本更低。

該公司對開源的承諾使其與大多數中國人工智能公司區分開來，後者與其美國競爭對手一樣傾向於閉源模型。DeepSeek的低調創始人梁文峯在去年7月接受中國媒體採訪時表示，公司並不優先考慮其人工智能模型的商業化，開源具有軟實力。

“讓其他人跟隨你的創新會帶來巨大的成就感，”梁在7月表示。“實際上，開源更多是一種文化行為而非商業行為，貢獻於此使我們贏得尊重，”他補充道。

新的開源代碼將為DeepSeek已經公開分享的人工智能模型提供支持基礎設施，基於現有的開源模型框架。

該公告是在DeepSeek於週二推出了一種名為原生稀疏注意力（NSA）的新算法之後發佈的，該算法旨在提高長上下文中的訓練和推理效率。

上個月，DeepSeek的用户基礎激增。在中國，它是最受歡迎的聊天機器人服務，截至1月11日，活躍用户達2220萬，超過了豆瓣的1695萬，依據中國的AI產品追蹤網站Aicpb.com。