阿里發佈AI新模型 稱性能全球領先 | 聯合早報
zaobao
(杭州綜合訊)中國科技巨頭阿里巴巴本週發佈旗下人工智能(AI)大模型通義千問升級版,稱這個新模型性能全球領先,在多項測試中得分優於ChatGPT創始者美國OpenAI、美國臉書母公司Meta、中國初創公司深度求索(DeepSeek)等新發布的模型。
阿里巴巴旗下的雲計算和人工智能公司阿里雲,大年初一星期三(1月29日)凌晨在微信公眾號發佈通義千問最新的旗艦版模型Qwen2.5-Max,並稱新模型展現出極強的綜合性能。利好消息帶動阿里在美股價上漲6.7%。
阿里雲説,通義團隊分別對Qwen2.5-Max的指令模型和基座模型兩版本性能進行評估測試。
指令模型方面,阿里AI新模型在多個基準測試中比肩美國的Claude-3.5-Sonnet模型,並幾乎全面超越OpenAI最新的GPT-4o模型、Meta最新的Llama-3.1-405B模型,以及DeepSeek去年12月發佈的DeepSeek-V3模型。
AI大模型主要分為基座、對話、指令等版本,三者功能不同。基座模型通常用於處理廣泛的自然語言任務;指令模型則在基座模型上微調,並更擅長遵循人類指令。對話模型專門用於處理對話,能進行高質量的對話交流。
延伸閲讀
韓詠紅:中國AI科學家的“深度探索” 阿里、百度跟進AI大模型價格戰 在基座模型方面,阿里AI新模型在11項基準測試中,全部超越DeepSeek-V3、Llama-3.1-405B。
路透社分析,阿里選擇大年初一發布Qwen 2.5-Max是較為特殊的時間點,顯示DeepSeek過去三週迅速崛起,給中國境內外競爭對手帶來壓力。
不過,阿里雲並未將Qwen 2.5-Max,與1月20日問世的深度求索最新模型DeepSeek-R1進行對比。
與騰訊、百度等一樣,阿里近年投入大量資源到雲服務領域,積極招募AI開發員來使用其工具。這些雲服務提供商近月紛紛下調價格以爭取更多用户,DeepSeek加入戰局預計將導致這波價格戰更加激烈。