新一代通義千問模型Qwen3開源
科技日報訊 (記者崔爽)阿里巴巴日前宣佈開源新一代通義千問模型Qwen3(以下簡稱“千問3”)。其參數量僅為DeepSeek-R1的三分之一,在成本大幅下降的同時,性能全面超越OpenAI-o1等全球頂尖模型。這是國內首個混合推理模型,可“秒回”簡單需求,大大節省算力。
諾貝爾經濟學獎得主丹尼爾·卡尼曼認為,人類思維分為慢思考和快思考。慢思考包括邏輯推理、複雜計算和批判性思考;快思考則基於直覺和情感,消耗認知資源極少,適合日常簡單任務。
傳統的AI大模型,回覆用户發來的“謝謝”“再見”等寒暄,也要耗費大量算力。研究者一直試圖模擬人腦,讓AI做到“簡單任務不假思索,複雜任務深思熟慮”。然而,要融合快與慢兩種思考方式,做到互不干擾,卻並不容易。這就好像“左手畫圓、右手畫方”,需要極其精細、創新的設計及訓練方法。混合推理模型是頭部公司爭相攻關的前沿技術,目前全球熱門模型中只有千問3、Claude3.7以及Gemini 2.5 Flash可以做到。
用户可為千問3設置“思考預算”,讓機器知道該耗費多少“心力”。推理模式下,千問3執行更多步驟——分解問題、推導、驗證、給出深思熟慮的答案;非推理模式下,模型直接生成答案。前者的計算成本大致是後者的2到5倍。
在節省算力的同時,千問3各方面性能也大幅增強。在考察奧數水平的AIME25測評中,千問3刷新開源大模型紀錄;在考察代碼能力的LiveCodeBench評測中,千問3表現超過Grok3;在評估模型人類偏好對齊的ArenaHard測評中,千問3超越OpenAI-o1。千問3在全球開發者社區GitHub發佈後4個小時獲得1.7萬個星標,刷新了開源大模型的熱度紀錄。
同時,千問3的顯存佔用僅為性能相近模型的三分之一。由於算力門檻低,手機、智能眼鏡、人形機器人等都更可能應用這種大模型。
此外,千問3宣佈支持119種語言,包括斯瓦希里語、意第緒語、亞美尼亞語、爪哇語等小語種。