DeepSeek將分享AI模型代碼,加倍對開源的投入 | 路透社
Reuters
DeepSeek 的標誌
27/01/2025
路透社/Dado Ruvic/插圖/檔案 北京,2月21日(路透社) - 中國初創公司 DeepSeek 週五宣佈,將向公眾提供其模型的代碼,重申其對開源人工智能的承諾。
該公司在社交媒體平台 X 上發佈消息稱,將在下週開放五個源代碼庫,稱這一舉措是“一個小而真誠的進步”,將以“完全透明”的方式分享。
“我們在線服務中的這些謙遜的構建塊已經在生產中進行了文檔記錄、部署和現場測試,”該發佈聲明稱。
上個月,DeepSeek 發佈了其開源推理模型 R1,震撼了全球人工智能行業,該模型在性能上與西方系統相媲美,並且開發成本更低。
該公司對開源的承諾使其與中國大多數人工智能公司區分開來,這些公司與美國的競爭對手一樣,傾向於封閉源代碼模型。DeepSeek 的低調創始人梁文峯在去年七月接受中國媒體的罕見採訪時表示,公司並未優先考慮其人工智能模型的商業化,並且開源可以獲得軟實力。
“讓其他人跟隨你的創新會帶來巨大的成就感,”梁在七月説。
“實際上,開源更多是一種文化行為而非商業行為,為此做出貢獻會讓我們贏得尊重,”他補充道。
新發布的開源代碼將提供基礎設施,以支持DeepSeek已經公開分享的AI模型,基於現有的開源代碼模型框架。
這一公告是在DeepSeek於週二發佈了一種名為原生稀疏注意力(NSA)的新算法之後,該算法旨在使長上下文的訓練和推理更加高效。
自上個月以來,DeepSeek的用户基礎激增。在中國,它是最受歡迎的聊天機器人服務,截至1月11日,活躍用户達2220萬,超過了豆瓣的1695萬用户,根據跟蹤AI產品的中國網站Aicpb.com的數據。
(報道:Liam Mo,Eduardo Baptista和Brenda Goh)
(翻譯:聖保羅編輯部)
路透社
- 建議主題:
- 科技