DeepSeek-V3.2-Exp模型正式發佈並開源 API大幅度降價
【環球網科技綜合報道】9月29日,據DeepSeek官方消息,DeepSeek-V3.2-Exp大語言模型正式發佈並開源。該模型通過引入創新的稀疏Attention架構,在降低計算資源消耗的同時顯著提升推理效率,為長序列文本處理提供了更優解決方案。

據官方介紹,DeepSeek-V3.2-Exp 模型是一個實驗性(Experimental)的版本。作為邁向新一代架構的中間步驟,V3.2-Exp 在 V3.1-Terminus 的基礎上引入了 DeepSeek Sparse Attention(一種稀疏注意力機制),針對長文本的訓練和推理效率進行了探索性的優化和驗證。
具體來説,DeepSeek Sparse Attention(DSA)首次實現了細粒度稀疏注意力機制,在幾乎不影響模型輸出效果的前提下,實現了長文本訓練和推理效率的大幅提升。
目前,官方App、網頁端、小程序均已同步更新為DeepSeek-V3.2-Exp,同時API大幅度降價。據官方稱,在新的價格政策下,開發者調用 DeepSeek API 的成本將降低 50% 以上。(青山)