Character.AI推出AvatarFX模型:讓靜態圖片人物“開口説話”
【環球網科技綜合報道】4月23日消息,人工智能創新企業Character.AI正式宣佈推出革命性視頻生成模型AvatarFX,該技術首次實現將靜態圖片轉化為可説話、可互動的動態視頻角色。

據悉,AvatarFX的核心技術基於“SOTA DiT-based diffusion video generation model”(基於擴散模型的動態視頻生成系統),這一前沿AI架構通過深度學習算法,將靜態圖像與音頻條件化技術深度融合。Character.AI團隊透露,模型在訓練過程中融合了創新的蒸餾與推理策略,能夠精準捕捉音頻特徵並同步生成唇部運動、表情變化及自然肢體動作,確保視頻輸出的高保真度與時間一致性。
從具體技術來看,超即時生成能力意味着AvatarFX支持長序列敍事與多角色對話場景,用户僅需上傳一張角色圖片及對應音頻,即可在短時間內生成流暢視頻,大幅降低內容創作門檻。多樣化音頻支持:內置男聲、女聲及多風格語音庫,用户可自由組合角色形象與聲音特徵,打造個性化虛擬IP。安全保障體系:平台內置多層級內容審核機制,通過即時監控與過濾技術,確保生成內容符合安全規範,為創作者提供無風險創作環境。
從應用層面看,AvatarFX的推出為虛擬內容創作帶來全新可能。在教育領域,教師可通過虛擬形象實現生動化教學;在娛樂行業,虛擬偶像可即時與觀眾互動;在社交媒體,用户可快速生成動態頭像與短視頻內容。此外,該技術還可應用於影視製作、歷史人物復原及文化遺產數字化等領域,顯著提升內容生產效率與創意空間。
目前,用户可通過官方網站(模型入口鏈接)體驗這一技術。(青山)