阿里雲初一發布通義千問旗艦版模型Qwen2.5-Max | 聯合早報

zaobao

2025-01-29

中國阿里雲在大年初一發布通義千問旗艦版模型Qwen2.5-Max，並稱在指令模型版本性能測試中，幾乎全面超越深度求索DeepSeek-V3等其他模型。

阿里雲星期三（1月29日）凌晨在微信公眾號宣佈，Qwen2.5-Max全新升級發佈，並説新模型展現出極強勁的綜合性能，在多項公開主流模型評測基準上錄得高分，全面超越了目前全球領先的開源混合專家（MoE）模型以及最大的開源稠密模型。

阿里雲也説，通義團隊分別對Qwen2.5-Max的指令（Instruct）模型版本和基座（base）模型版本性能進行了評估測試。

在指令模型方面，Qwen2.5-Max在多個基準測試中比肩美國的Claude-3.5-Sonnet模型，並幾乎全面超越了另外三個美國模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

在基座模型方面，阿里雲則説，通義團隊將Qwen2.5-Max與目前領先的開源MoE模型 DeepSeek V3、最大的開源稠密模型Llama-3.1-405B，以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中，Qwen2.5-Max全部超越了對比模型。

延伸閲讀

[下午察：中國超英趕美問鼎全球AI霸主地位

](https://www.bdggg.com/2025/zaobao/news_2025_01_28_736021) 路透社報道，選擇大年初一發布Qwen 2.5-Max是較為特殊的時間點，也顯示了深度求索過去三週迅速崛起，給中國境內外競爭對手帶來壓力。

深度求索1月20日發佈推理模型DeepSeek-R1後，字節跳動旗下豆包更新版大模型1.5-pro上星期三（22日）正式發佈。

據IT之家報道，1.5-pro模型增強了綜合能力，在知識、代碼、推理、中文等多個測評基準上，綜合得分優於GPT-4o、Claude 3.5 Sonnet 等模型。