Deepseek發佈V3.1 為何火的卻是官方留言?
【環球網科技報道 記者 李文瑤】8月21日,Deepseek宣佈正式推出DeepSeek-V3.1,在混合推理架構、思考效率、Agent 能力等方面進行了全面升級。不過,最值得關注的是,官方在留言中補充説明道,UE8M0 FP8是針對即將發佈的下一代國產芯片設計。


一石激起千層浪。作為國內最具代表性的AI大模型之一,DeepSeek的這一官方留言立刻在資本市場引起連鎖反應。8月22日,寒武紀、海光信息等企業的股價在短期內出現上漲。市場普遍認為,FP8技術的優化將推動國產芯片在AI訓練和推理場景下的性能提升,進而擴大市場份額。
據瞭解,在人工智能和高性能計算領域,數據精度與計算效率之間的平衡一直是技術演進的核心問題。FP8(8位浮點數)作為一種新興的數據格式,能夠在幾乎不損失模型精度的情況下,大幅提升計算速度並降低功耗,尤其適用於大規模神經網絡訓練和推理。
目前,國內的芯片公司只有極少數GPU廠商支持FP8,比如摩爾線程,其旗艦產品MTT S5000就是國內首批原生支持FP8並大規模量產的GPU。摩爾線程的MUSA架構原生支持硬件FP8張量加速計算,能夠很好地支持UE8M0 FP8 Scale,利用硬件原生FP8,相對於傳統的FP16計算能夠實現兩倍的浮點算力提升、訪存和通信帶寬效率提升和存儲容量利用率提升,同時最優化張量表達精度。
而DeepSeek此次推出的UE8M0 FP8技術,便是在通過對FP8格式的深度優化,為下一代國產芯片提供底層支持。該技術通過減少數據存儲和傳輸的耗損,顯著提升芯片的吞吐量和能效比,進一步強化國產AI芯片在國內外市場的競爭力。
從行業來看,隨着英偉達、AMD等國際巨頭紛紛佈局FP8,這一格式有望成為下一代AI訓練和推理的通用標準。DeepSeek在此時推出UE8M0 FP8技術,意味着中國企業在標準制定階段便已深度參與,甚至可能影響全球技術路線的走向。
DeepSeek作為AI算法起家的公司,此次向芯片技術延伸,也體現了軟件定義硬件(Software-Defined Hardware)的趨勢。優秀的軟件棧和算法優化能力,正在成為提升硬件性能的關鍵因素。
但需要留意的是,FP8作為一種新興格式,其軟件生態、開發者工具鏈、框架支持等尚不成熟,需要產業鏈上下游共同推進。