DeepSeek將分享其人工智能模型的部分代碼,加大對開源的投入 | 路透社
Reuters
北京,2月21日(路透社) - 中國的DeepSeek宣佈將公開其模型的代碼,這家初創公司在週五重申了其對開源人工智能的承諾。
該公司在社交媒體平台X上發佈消息稱,將在下週開放5個源代碼庫,稱這一舉措是“微小但真誠的進展”,將“完全透明”地分享。
“這些我們在線服務的謙遜構建塊已經被記錄、部署並在生產中經過實戰測試,”該發佈稱。
DeepSeek上個月在全球人工智能行業引起轟動,當時它發佈了開源推理模型R1,該模型在性能上與西方系統相媲美,同時開發成本更低。
該公司對開源的承諾使其與大多數中國人工智能公司區分開來,後者與其美國競爭對手一樣傾向於閉源模型。DeepSeek的低調創始人梁文峯在去年7月接受中國媒體採訪時表示,公司並不優先考慮其人工智能模型的商業化,開源具有軟實力。
“讓其他人跟隨你的創新會帶來巨大的成就感,”梁在7月表示。“實際上,開源更多是一種文化行為而非商業行為,貢獻於此使我們贏得尊重,”他補充道。
新的開源代碼將為DeepSeek已經公開分享的人工智能模型提供支持基礎設施,基於現有的開源模型框架。
該公告是在DeepSeek於週二推出了一種名為原生稀疏注意力(NSA)的新算法之後發佈的,該算法旨在提高長上下文中的訓練和推理效率。
上個月,DeepSeek的用户基礎激增。在中國,它是最受歡迎的聊天機器人服務,截至1月11日,活躍用户達2220萬,超過了豆瓣的1695萬,依據中國的AI產品追蹤網站Aicpb.com。
- 建議主題:
- 技術