中國MiniMax公司稱其新型AI推理模型超越深度求索——彭博社

bloomberg

2025-06-17

中國AI新秀MiniMax發佈了一款新的大型語言模型，加入了一眾國內同行的行列，這些公司都受到啓發，希望在推理AI領域超越DeepSeek。

這家總部位於上海的公司吹捧其新模型MiniMax-M1在處理複雜生產力任務方面的效率，聲稱它超越了所有中國閉源競爭對手在一份聲明中。在MiniMax提供的多項基準測試中，M1的得分也高於DeepSeek最新的R1-0528模型。

#MiniMaxWeek的第1/5天：#MiniMaxWeek：我們開源了MiniMax-M1，這是我們最新的LLM——在長上下文推理方面設定了新標準。- 全球最長的上下文窗口：100萬token輸入，8萬token輸出- 開源模型中最佳的代理使用體驗- 無與倫比的強化學習效率：… pic.twitter.com/bGfDlZA54n

— MiniMax (官方) (@MiniMax__AI) 2025年6月16日

M1支持百萬級tokens的上下文長度，是深度求索R1的八倍。上下文長度有助於AI系統同時處理更多信息。該公司表示，在某些情況下，MiniMax的模型僅需消耗深度求索約30%的資源。彭博社尚未獨立驗證MiniMax的聲明。

該公司聲明稱，其採用大規模強化學習訓練M1模型，動用了512塊英偉達H800 GPU，租賃成本達534,700美元。

MiniMax獲得中國互聯網巨頭騰訊控股與阿里巴巴集團支持，屬於國內六家頂尖AI初創企業"小龍"之列。過去一年間，這些企業共籌集數十億美元風投資金——但隨着深度求索的崛起，該團體中多數公司已縮減或終止基礎研究，轉而聚焦應用開發。

MiniMax表示將在未來幾天公佈更多進展。該公司其他產品包括視頻生成工具及AI伴侶應用。