DeepSeek將分享一些AI模型代碼,進一步加強開源| 路透社
Reuters
Deepseek的標誌在2025年1月29日的插圖中可見。路透社/Dado Ruvic/插圖/檔案照片北京,2月21日(路透社) - 中國初創公司DeepSeek表示將公開其模型的代碼,週五重申了其對開源人工智能的承諾。該公司在社交媒體平台X上發佈的一條消息中表示,將在下週開源5個代碼庫,稱這一舉措是“微小但真誠的進展”,並將“以完全透明的方式”分享。
“我們在線服務中的這些謙遜構建塊已經被記錄、部署並在生產中經過實戰測試。”該消息稱。
DeepSeek 上個月震動了全球人工智能行業,當時它發佈了其開源的R1推理模型,該模型在性能上與西方系統相抗衡,同時開發成本更低。該公司對開源的承諾使其與中國大多數人工智能公司區分開來,這些公司與其美國競爭對手一樣,傾向於閉源模型。DeepSeek的低調創始人梁文峯在去年7月與一家中國媒體的罕見採訪中表示,該公司並不優先考慮商業化其人工智能模型,並且從開源中可以獲得軟實力。“讓他人跟隨你的創新會帶來很大的成就感,”梁在七月説道。
“事實上,開源更多是一種文化行為,而非商業行為,參與其中讓我們贏得了尊重,”他補充道。
新發布的開源代碼將提供基礎設施,以支持DeepSeek已經公開分享的AI模型,建立在現有的開源模型框架之上。
這一公告是在DeepSeek週二發佈了一種名為原生稀疏注意力(NSA)的新算法之後,該算法旨在提高長上下文訓練和推理的效率。
自上個月以來,DeepSeek的用户基礎激增。在中國,截至1月11日,它是最受歡迎的聊天機器人服務,擁有2220萬日活躍用户,超過了豆瓣的1695萬用户,依據追蹤AI產品的中國網站Aicpb.com的數據。
路透社日報簡報提供您開始一天所需的所有新聞。請在 這裏註冊。
- 推薦主題:
- 人工智能