阿里巴巴推出最新AI圖像服務以吸引用户——彭博社
Luz Ding
中國杭州阿里巴巴集團控股有限公司總部。
攝影師:沈起來/彭博社阿里巴巴集團控股有限公司發佈了其人工智能技術的新版本,該技術將使用户更容易根據文本和視覺內容生成和修改圖像,這家中國電商巨頭正持續加碼人工智能領域。
這家總部位於杭州的公司推出了通義千問VLo,這是其Qwen品牌下的一系列人工智能服務之一。新模型是Qwen2.5-VL的升級版,現在能夠生成文本到圖像和圖像到圖像的結果。它還擁有一項名為漸進式生成的技術,意味着用户可以觀看圖像生成的全過程。
“這次全新升級的模型不僅能‘理解’世界,還能基於這種理解生成高質量的創作,”該公司在一篇博客文章中表示。“你可以直接發送諸如‘生成一張可愛貓咪的圖片’這樣的提示來生成圖像,或者上傳一張貓咪圖片並指示‘給貓咪頭上加頂帽子’來修改圖像。”
以在中國市場的電商業務聞名的阿里巴巴,一直在積極進軍人工智能領域,並圍繞Qwen構建獨立產品。今年二月,首席執行官吳泳銘甚至表示,公司現在的“首要目標”是通用人工智能(AGI),這是業界追求構建具有人類水平智能的AI系統的目標。
通過新的通義千問多模態模型,阿里巴巴旨在與市場上包括OpenAI在內的眾多新型視覺界面競爭。同時,它還面臨着來自深度求索等國內企業的激烈競爭。
在深度求索以宣稱僅耗資數百萬美元構建的強大模型震驚業界後,中國科技巨頭迅速推出了一系列低成本AI服務搶佔市場。阿里巴巴快速迭代其Qwen系列,新增了處理文本、圖片、音頻和視頻的多模態能力——這些模型能高效運行於手機和筆記本電腦。該公司還在三月發佈了新版AI助手應用夸克。
視頻:中國深度求索如何挑戰AI巨頭。