深度求索公司公開AI技術細節獲開源社區讚譽 | 南華早報
Ben Jiang
中國人工智能初創企業深度求索(DeepSeek)公開了其低成本高性能模型的技術細節,駁斥了關於虛報成本的指控,同時贏得開源社區的喝彩。
這家總部位於杭州的研究機構還兑現了本週將發佈五個開源AI基礎設施項目的承諾。該公司於週一和週二先後發佈了名為FlashMLA和DeepEP的兩個項目,均致力於充分挖掘芯片性能以實現高性價比的模型訓練與推理任務。
舊金山AI行業解決方案提供商Dragonscale Industries首席技術官Stephen Pimentel在X平台發帖稱,通過開源模型訓練技術成果,深度求索"有力回擊了關於’他們在訓練流程上造假’的常見指控"。
開源開發者們為深度求索的新項目歡呼。X平台一位評論者表示:“深度求索再次突破了AI基礎設施的潛力邊界。”
01:20
中國阿里巴巴發佈新AI模型 據稱性能超越深度求索和OpenAI的GPT-4o
中國阿里巴巴發佈新AI模型 據稱性能超越深度求索和OpenAI的GPT-4o
深度求索已發佈兩款突破性開源AI模型——V3大語言模型和R1推理模型,其性能可媲美微軟投資的OpenAI、亞馬遜支持的Anthropic等美國AI巨頭的最優專有模型。