阿里巴巴(BABA)發佈新款AI模型可在手機上處理視頻和音頻 - 彭博社

Edwin Chan

2025-03-27

隨着模型演進，阿里巴巴希望成為企業開發和應用現實世界AI技術的關鍵合作伙伴。

攝影師：沈啓來/彭博社阿里巴巴集團控股有限公司發佈了通義千問系列新一代人工智能模型，該模型可處理文本、圖片、音頻和視頻，其高效性足以直接在手機和筆記本電腦上運行。

公司表示，這款已在Hugging Face和GitHub開源的新模型，將用於構建能通過即時音頻描述幫助視障人士感知環境等功能的AI智能體。

自全面投入AI技術以來，阿里巴巴今年正以驚人速度發佈AI產品。這家中國電商與雲計算巨頭在深度求索1月引發關注後數日便推出了新版通義千問模型。本月早些時候，其AI助手夸克應用也發佈了新版本。

阿里巴巴並非唯一開發多模態模型的AI企業。OpenAI與Alphabet旗下谷歌均提供能處理文本、音頻等多類型輸入的生成式AI工具。週二OpenAI還為ChatGPT升級了更先進的圖像生成功能以擴展其能力。

阿里巴巴在一份聲明中表示，其全新的Qwen2.5-Omni-7B系統在語音理解與生成方面展現出卓越性能。

這家由馬雲聯合創立的互聯網巨頭宣佈，未來在人工智能和雲計算領域的投入將超過過去十年總和。隨着AI模型迭代對算力需求激增，阿里巴巴致力於成為企業實現AI技術開發與實體應用落地的核心合作伙伴。

瞭解更多中國AI復興動態
深度求索成功後中國AI模型席捲全球阿里蔡崇信預警AI數據中心建設存在"泡沫"阿里巴巴領跑中國AI競賽緊追深度求索馬雲旗下螞蟻集團宣佈基於國產芯片實現AI突破

自深度求索以僅耗資數百萬美元打造的強大模型超越OpenAI後，中國科技企業接連推出低成本AI服務，對OpenAI和谷歌等公司的高價產品形成價格壓制。

儘管這些中國AI產品是否真正匹敵或超越西方頂尖系統尚無定論，但這些新選擇正給美國頭部企業的商業模式帶來更大壓力。