阿里雲宣佈：全面趕超GPT-4

2024-05-09

5月9日，阿里雲正式發佈通義千問2.5，阿里雲表示，該模型性能全面趕超GPT-4 Turbo。

據介紹，相比通義千問2.1版本，通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。

對比GPT-4，在中文語境下，通義千問2.5在文本理解、文本生成、知識問答&生活建議、閒聊對話，以及安全風險等多項能力上均全面趕超。

在權威基準OpenCompass上，通義千問2.5得分追平GPT-4 Turbo，是國產大模型首次在該基準取得這樣的成績。

此外，原通義千問APP正式宣佈更名為“通義APP”。

阿里雲也於今日發佈了最新款開源模型1100億參數的Qwen1.5-110B，據稱該模型在MMLU、TheoremQA、GPQA等基準測評中超越了Meta的Llama-3-70B模型。HuggingFace推出的開源大模型排行榜OpenLLMLeaderboard上，Qwen1.5-110B位列榜首。

在加速技術進步的同時，國產大模型也正推進在行業落地。據披露，目前通義大模型已通過阿里雲服務企業超9萬、通過釘釘服務企業超過220萬，通義開源模型累計下載量突破700萬。通義落地應用進程加速，現已進入PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

今日港股收盤，阿里巴巴港股報76.8港元/股，漲幅0.85%，總市值15647億港元，今日開盤價為75.75港元。

本文系觀察者網獨家稿件，未經授權，不得轉載。