字節跳動升級豆包AI應用 新增即時互動視頻通話功能 | 南華早報
Coco Feng
抖音母公司字節跳動近日升級了其豆包聊天機器人,這是中國最受歡迎的面向消費者的人工智能(AI)應用之一,最近推出的即時視頻通話功能將該應用轉變為交互式數字助手。根據上週五通過豆包微信公眾號發佈的公告,該功能允許用户與聊天機器人背後的AI技術進行互動視頻對話。用户只需在語音通話時打開智能手機的攝像頭即可激活該功能。一旦激活,豆包可以即時自動充當博物館參觀時的講解員;觀察植物時具備園藝知識的導師;在雜貨店購買食材時的食譜大師;以及研究圖表、圖形或視頻時的分析師。
據豆包介紹,新功能基於字節跳動的視覺推理AI模型構建,該模型整合了視覺和語言輸入,以支持內容創作和主題深入研究。它還支持在線搜索以從互聯網獲取最新信息。
豆包的即時互動視頻通話功能展示了字節跳動在生成式AI(GenAI),展示了基於其自身AI模型構建的產品所具備的先進多模態能力。GenAI指的是用於創建新內容的算法,包括音頻、代碼、圖像、文本、模擬和視頻。本月早些時候,豆包展示了其將任何照片轉換為像素藝術的能力。2月,母公司字節跳動推出了OmniHuman-1多模態AI模型,該模型因其能將照片和聲音片段轉換為逼真視頻的能力而廣受關注。
智能手機上顯示的中國聊天機器人應用圖標。這些圖標按順時針方向依次為:科大訊飛的星火、字節跳動的豆包、智譜AI的智譜清言和百度的文心一言。照片:Shutterstock