中國MiniMax公司稱其新型AI推理模型超越深度求索——彭博社
bloomberg
中國AI新秀MiniMax發佈了一款新的大型語言模型,加入了一眾國內同行的行列,這些公司都受到啓發,希望在推理AI領域超越DeepSeek。
這家總部位於上海的公司吹捧其新模型MiniMax-M1在處理複雜生產力任務方面的效率,聲稱它超越了所有中國閉源競爭對手在一份聲明中。在MiniMax提供的多項基準測試中,M1的得分也高於DeepSeek最新的R1-0528模型。
#MiniMaxWeek的第1/5天:#MiniMaxWeek:我們開源了MiniMax-M1,這是我們最新的LLM——在長上下文推理方面設定了新標準。- 全球最長的上下文窗口:100萬token輸入,8萬token輸出- 開源模型中最佳的代理使用體驗- 無與倫比的強化學習效率:… pic.twitter.com/bGfDlZA54n
— MiniMax (官方) (@MiniMax__AI) 2025年6月16日
M1支持百萬級tokens的上下文長度,是深度求索R1的八倍。上下文長度有助於AI系統同時處理更多信息。該公司表示,在某些情況下,MiniMax的模型僅需消耗深度求索約30%的資源。彭博社尚未獨立驗證MiniMax的聲明。
該公司聲明稱,其採用大規模強化學習訓練M1模型,動用了512塊英偉達H800 GPU,租賃成本達534,700美元。
MiniMax獲得中國互聯網巨頭騰訊控股與阿里巴巴集團支持,屬於國內六家頂尖AI初創企業"小龍"之列。過去一年間,這些企業共籌集數十億美元風投資金——但隨着深度求索的崛起,該團體中多數公司已縮減或終止基礎研究,轉而聚焦應用開發。
MiniMax表示將在未來幾天公佈更多進展。該公司其他產品包括視頻生成工具及AI伴侶應用。