Character.AI推出AvatarFX模型：讓靜態圖片人物“開口説話”

2025-04-23

【環球網科技綜合報道】4月23日消息，人工智能創新企業Character.AI正式宣佈推出革命性視頻生成模型AvatarFX，該技術首次實現將靜態圖片轉化為可説話、可互動的動態視頻角色。

據悉，AvatarFX的核心技術基於“SOTA DiT-based diffusion video generation model”（基於擴散模型的動態視頻生成系統），這一前沿AI架構通過深度學習算法，將靜態圖像與音頻條件化技術深度融合。Character.AI團隊透露，模型在訓練過程中融合了創新的蒸餾與推理策略，能夠精準捕捉音頻特徵並同步生成唇部運動、表情變化及自然肢體動作，確保視頻輸出的高保真度與時間一致性。

從具體技術來看，超即時生成能力意味着AvatarFX支持長序列敍事與多角色對話場景，用户僅需上傳一張角色圖片及對應音頻，即可在短時間內生成流暢視頻，大幅降低內容創作門檻。多樣化音頻支持：內置男聲、女聲及多風格語音庫，用户可自由組合角色形象與聲音特徵，打造個性化虛擬IP。安全保障體系：平台內置多層級內容審核機制，通過即時監控與過濾技術，確保生成內容符合安全規範，為創作者提供無風險創作環境。

從應用層面看，AvatarFX的推出為虛擬內容創作帶來全新可能。在教育領域，教師可通過虛擬形象實現生動化教學；在娛樂行業，虛擬偶像可即時與觀眾互動；在社交媒體，用户可快速生成動態頭像與短視頻內容。此外，該技術還可應用於影視製作、歷史人物復原及文化遺產數字化等領域，顯著提升內容生產效率與創意空間。

目前，用户可通過官方網站（模型入口鏈接）體驗這一技術。（青山）