阿里雲宣佈:全面趕超GPT-4
贺喜格[email protected] 来撩

5月9日,阿里雲正式發佈通義千問2.5,阿里雲表示,該模型性能全面趕超GPT-4 Turbo。
據介紹,相比通義千問2.1版本,通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。
對比GPT-4,在中文語境下,通義千問2.5在文本理解、文本生成、知識問答&生活建議、閒聊對話,以及安全風險等多項能力上均全面趕超。
在權威基準OpenCompass上,通義千問2.5得分追平GPT-4 Turbo,是國產大模型首次在該基準取得這樣的成績。
此外,原通義千問APP正式宣佈更名為“通義APP”。
阿里雲也於今日發佈了最新款開源模型1100億參數的Qwen1.5-110B,據稱該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型。HuggingFace推出的開源大模型排行榜OpenLLMLeaderboard上,Qwen1.5-110B位列榜首。
在加速技術進步的同時,國產大模型也正推進在行業落地。據披露,目前通義大模型已通過阿里雲服務企業超9萬、通過釘釘服務企業超過220萬,通義開源模型累計下載量突破700萬。通義落地應用進程加速,現已進入PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。
今日港股收盤,阿里巴巴港股報76.8港元/股,漲幅0.85%,總市值15647億港元,今日開盤價為75.75港元。
本文系觀察者網獨家稿件,未經授權,不得轉載。