阿里巴巴推出一款聲稱超越DeepSeek-V3的人工智能模型 | 路透社
Eduardo Baptista
北京,1月29日(路透社) - 中國科技公司阿里巴巴(9988.HK)於本週三推出了其人工智能模型Qwen 2.5的新版本,稱其已超越DeepSeek-V3。Qwen 2.5-Max的發佈時機頗為特殊,恰逢農曆新年的第一天,此時大多數中國人都在休假,這顯示出中國人工智能初創公司DeepSeek在過去三週內的迅猛崛起對外國競爭對手以及國內競爭者施加的壓力。
阿里巴巴的雲計算部門在其官方微信賬號發佈的公告中表示:“Qwen 2.5-Max超越了(…)幾乎所有的GPT-4o、DeepSeek-V3和Llama-3.1-405B”,指的是美國OpenAI和Meta的最先進的開源人工智能模型。
1月10日,DeepSeek推出了其配備DeepSeek-V3模型的人工智能助手,以及1月20日推出的R1模型,震驚了硅谷,並導致全球科技公司股票暴跌。
但DeepSeek的成功也引發了國內競爭對手之間的競賽,以更新他們自己的人工智能模型。
在DeepSeek-R1發佈兩天後,抖音母公司字節跳動推出了其主要人工智能模型的更新,稱其在AIME測試中超越了OpenAI的o1,該測試衡量人工智能模型理解和響應複雜指令的能力。
這呼應了DeepSeek的聲明,即其R1模型在多個性能基準測試中與o1相媲美。
DEEPSEEK與中國競爭對手
DeepSeek的V3模型的前身DeepSeek-V2在去年五月發佈後,引發了中國人工智能模型的價格戰。
DeepSeek-V2是開源且便宜,每百萬個令牌(或模型處理的數據單位)僅需1元人民幣(0.14美元),這使得阿里巴巴的雲計算部門宣佈對一系列模型的價格削減高達97%。
其他中國科技公司也紛紛效仿,包括百度 (9888.HK),該公司在2023年3月推出了中國首個相當於ChatGPT的產品,以及中國最有價值的科技公司騰訊 (0700.HK)。DeepSeek的創始人梁文峯在7月接受中國媒體Waves的罕見採訪時表示,這家初創公司“並不在乎”價格戰,達到AGI(通用人工智能)是其主要目標。
OpenAI將AGI定義為在經濟上最有價值的任務中超越人類的自主系統。
儘管像阿里巴巴這樣的中國大型科技公司擁有數十萬名員工,DeepSeek卻作為一個研究實驗室運作,團隊主要由來自中國頂尖大學的年輕畢業生和博士生組成。
梁在七月的採訪中表示,他認為中國最大的科技公司可能不適合人工智能行業的未來,因其高昂的成本和自上而下的結構與DeepSeek的精簡運營和靈活管理風格形成對比。
“大型基礎模型需要持續創新,科技巨頭的能力是有限的,”他説。
((翻譯 編輯 聖保羅, 55 11 56447753))
路透社 AAJ
- 建議話題:
- 科技