深度求索公司公開AI技術細節獲開源社區讚譽 | 南華早報

Ben Jiang

2025-02-26

中國人工智能初創企業深度求索（DeepSeek）公開了其低成本高性能模型的技術細節，駁斥了關於虛報成本的指控，同時贏得開源社區的喝彩。

這家總部位於杭州的研究機構還兑現了本週將發佈五個開源AI基礎設施項目的承諾。該公司於週一和週二先後發佈了名為FlashMLA和DeepEP的兩個項目，均致力於充分挖掘芯片性能以實現高性價比的模型訓練與推理任務。

舊金山AI行業解決方案提供商Dragonscale Industries首席技術官Stephen Pimentel在X平台發帖稱，通過開源模型訓練技術成果，深度求索"有力回擊了關於’他們在訓練流程上造假’的常見指控"。

開源開發者們為深度求索的新項目歡呼。X平台一位評論者表示：“深度求索再次突破了AI基礎設施的潛力邊界。”

01:20

中國阿里巴巴發佈新AI模型據稱性能超越深度求索和OpenAI的GPT-4o

深度求索已發佈兩款突破性開源AI模型——V3大語言模型和R1推理模型，其性能可媲美微軟投資的OpenAI、亞馬遜支持的Anthropic等美國AI巨頭的最優專有模型。