阿里巴巴發佈了一種人工智能模型,稱其超越了DeepSeek-V3 | 路透社
Eduardo Baptista
北京,1月29日(路透社) - 中國科技公司阿里巴巴(9988.HK)在週三推出了其人工智能模型Qwen 2.5的新版本,並聲稱其超越了備受讚譽的DeepSeek-V3。Qwen 2.5-Max的發佈時機頗為特殊,正值農曆新年的第一天,屆時大多數中國人都在與家人團聚,顯示出中國人工智能公司DeepSeek在過去三週的迅猛崛起對其外國競爭對手以及國內競爭者施加的壓力。
阿里巴巴雲計算部門在其官方微信賬號發佈的公告中表示:“Qwen 2.5-Max幾乎超越了GPT-4o、DeepSeek-V3和Llama-3.1-405B”,這是指OpenAI和Meta的最先進的開源AI模型。
1月10日,基於DeepSeek-V3模型的DeepSeek人工智能助手的發佈,以及1月20日其R1模型的推出,震驚了硅谷,並導致科技股暴跌。這家中國初創公司的開發和使用成本被認為較低,使得投資者開始質疑美國主要人工智能公司的龐大支出計劃。
但DeepSeek的成功也引發了國內競爭對手之間的鬥爭,以提升他們自己的人工智能模型。
在DeepSeek-R1發佈兩天後,抖音母公司字節跳動發佈了其旗艦人工智能模型的更新,聲稱其在AIME測試中超越了微軟支持的OpenAI的o1,該測試衡量人工智能模型理解和響應複雜指令的能力。
DeepSeek聲稱其R1模型在多個性能測試中與OpenAI的o1相媲美。
DEEPSEEK與國內競爭對手的對比
DeepSeek的V3模型的前身DeepSeek-V2在去年五月發佈後,引發了中國AI模型的價格戰。
DeepSeek-V2是開源的,且價格前所未有,僅為每百萬個token(或AI模型處理的數據單位)1元(0.14美元),這促使阿里巴巴的雲單位宣佈對一系列模型進行高達97%的降價。
其他中國科技公司也紛紛效仿,如百度 (9888.HK),該公司在2023年3月推出了中國首個ChatGPT的等效產品,以及中國最有價值的互聯網公司騰訊 (0700.HK)。DeepSeek的神秘創始人梁文峯在七月接受中國媒體Waves的罕見採訪時表示,該初創公司“並不在乎”價格戰,其主要目標是實現AGI(通用人工智能)。
OpenAI將AGI定義為在大多數經濟價值任務中超越人類的自主系統。
儘管像阿里巴巴這樣的中國大型科技公司擁有數十萬名員工,DeepSeek則作為一個研究實驗室運作,主要由來自中國頂尖大學的年輕畢業生和博士生組成。
梁在七月的採訪中表示,他認為中國最大的科技公司可能不適合人工智能行業的未來,將其高昂的成本和層級結構與DeepSeek的靈活運作和管理風格進行了對比。
“大型基礎模型需要持續創新,科技巨頭的能力是有限的,”他表示。
- 建議話題:
- 商業