阿里巴巴推出新AI模型,自稱性能超越中國最熱門初創公司深度求索 | 南華早報
Zhou Xin
阿里巴巴集團週三發佈了其通義千問AI模型的升級版本,稱該模型在部分基準測試中"全面超越"了去年12月由中國最熱門初創企業推出的大語言模型深度求索V3。這家電商巨頭旗下雲計算與人工智能部門阿里雲在微信聲明中表示,其新版Qwen2.5-Max模型在LLM性能基準平台Arena-Hard和LiveBench上也超越了OpenAI的GPT-4o及Meta Platforms的Llama-3.1-405B。阿里巴巴持有《南華早報》。阿里雲表示,作為通義千問大模型家族成員,Qwen2.5-Max的基準測試表現與Anthropic的Claude-3.5-Sonnet模型相當。大語言模型是支撐ChatGPT等生成式AI服務的基礎技術。阿里巴巴的多模態模型提供從30億到720億參數的不同規模版本,包含基礎版和指令調優版。旗艦模型Qwen2.5-VL-72B-Instruct現可通過通義千問平台使用,而整個Qwen2.5-VL系列已在開源平台Hugging Face和阿里自建開源社區上線模型範圍。參數是機器學習術語,指AI系統訓練過程中存在的變量,它幫助確定數據提示如何產生期望的輸出。開源使公眾能夠訪問軟件程序的源代碼,允許第三方開發者修改或分享其設計、修復損壞的鏈接或擴展其功能。
01:20
中國阿里巴巴發佈新AI模型,據稱性能優於競爭對手Deepseek和OpenAI的GPT-4o
中國阿里巴巴發佈新AI模型,據稱性能優於競爭對手Deepseek和OpenAI的GPT-4o
阿里巴巴股價在紐約近期交易中上漲近3%,延續了週二6.7%的漲幅,而香港交易因農曆新年假期暫停。