新一代通義千問模型Qwen3開源

2025-05-12

科技日報訊（記者崔爽）阿里巴巴日前宣佈開源新一代通義千問模型Qwen3（以下簡稱“千問3”）。其參數量僅為DeepSeek-R1的三分之一，在成本大幅下降的同時，性能全面超越OpenAI-o1等全球頂尖模型。這是國內首個混合推理模型，可“秒回”簡單需求，大大節省算力。

諾貝爾經濟學獎得主丹尼爾·卡尼曼認為，人類思維分為慢思考和快思考。慢思考包括邏輯推理、複雜計算和批判性思考；快思考則基於直覺和情感，消耗認知資源極少，適合日常簡單任務。

傳統的AI大模型，回覆用户發來的“謝謝”“再見”等寒暄，也要耗費大量算力。研究者一直試圖模擬人腦，讓AI做到“簡單任務不假思索，複雜任務深思熟慮”。然而，要融合快與慢兩種思考方式，做到互不干擾，卻並不容易。這就好像“左手畫圓、右手畫方”，需要極其精細、創新的設計及訓練方法。混合推理模型是頭部公司爭相攻關的前沿技術，目前全球熱門模型中只有千問3、Claude3.7以及Gemini 2.5 Flash可以做到。

用户可為千問3設置“思考預算”，讓機器知道該耗費多少“心力”。推理模式下，千問3執行更多步驟——分解問題、推導、驗證、給出深思熟慮的答案；非推理模式下，模型直接生成答案。前者的計算成本大致是後者的2到5倍。

在節省算力的同時，千問3各方面性能也大幅增強。在考察奧數水平的AIME25測評中，千問3刷新開源大模型紀錄；在考察代碼能力的LiveCodeBench評測中，千問3表現超過Grok3；在評估模型人類偏好對齊的ArenaHard測評中，千問3超越OpenAI-o1。千問3在全球開發者社區GitHub發佈後4個小時獲得1.7萬個星標，刷新了開源大模型的熱度紀錄。

同時，千問3的顯存佔用僅為性能相近模型的三分之一。由於算力門檻低，手機、智能眼鏡、人形機器人等都更可能應用這種大模型。

此外，千問3宣佈支持119種語言，包括斯瓦希里語、意第緒語、亞美尼亞語、爪哇語等小語種。