把數字人成本從數萬元打到幾十塊,京東斬獲這項唯一特等獎
周毅是故意的还是不小心?

據公號“京東黑板報”3月19日消息,近日,中國人工智能學會發布2024年度“吳文俊人工智能科學技術獎”公告,京東科技人工智能團隊憑藉“多模態交互式數字人關鍵技術及產業應用”項目榮獲中國智能科學技術最高獎——吳文俊人工智能科學技術獎的特等獎,也是本年度唯一的特等獎。
資料顯示,在本次獲獎項目中,京東科技人工智能團隊在以下三方面實現了技術突破:
提出了低成本、高保真人體建模技術,解決了人體建模成本高、觀感差難題
提出了語義一致多模態應答技術,解決了多模態語義難對齊、應答弱難題
提出了多模態自然化行為生成技術,解決了多樣化行為難協調、交互假難題
近期,京東言犀數字人技術再度進化。京東科技人工智能團隊打造的數字人通用的基座大模型,通過語音合成大模型LiveTTS及通用數字人大模型LiveHuman,僅需輸入自然語言或1秒視頻/照片,即可生成4K超高清、100%口型匹配的數字人,徹底告別數字人制作對線下拍攝、建模與耗時訓練的依賴。
LiveTTS語音合成基座模型,可以基於20萬小時數據訓練的擴散模型,實現“零樣本”聲音合成與多語種情感化輸出,音色相似度較其它頭部廠商高出1.3倍、字符錯誤率(CER)降低最高5.12%;LiveHuman數字人基座模型有創新性的人體過渡幀生成技術,解決多片段銜接卡頓難題,在遮擋、大角度、動態背景、多人直播等極端條件下仍有流暢表現。
這一系列突破將單個數字人生產成本從數萬元拉低至兩位數,較真人拍攝模式成本降幅超90%,標誌着數字人從“專業工具”正式成為“普惠生產力”。這將為廣告素材批量生成、新媒體投放、個人IP打造等場景應用拆掉技術藩籬,走向工業級應用。

數字人直播引發關注 央廣網報道截圖
談到AI數字人的產業應用,在2024世界人工智能大會上,京東雲言犀負責人曾對我們表示,用户已經跨過了AI數字人直播的“恐怖谷效應”。一旦人們接受了這樣的內容,那麼AI數字人直播帶來的好處就很多了:不只是解放人們的時間,可以實現一天24小時直播,它還可以實現多個數字人之間的互動,給用户帶來更加豐富的呈現內容,其中很多形態還是真人不一定能做到,甚至做不到的。

數字人正在湧入電商等各類產業場景 2024年WAIC現場圖
本文系觀察者網獨家稿件,未經授權,不得轉載。