宋慶齡“她”用滬語讀了生前最後一文_風聞
IT时报-《IT时报》官方账号-05-11 18:09

數字人成上海元宇宙賽道“先發優勢” 或迎來風口
作者/ IT時報記者 潘少穎
編輯/ 潘少穎 孫妍
上海音樂廳的舞台上,在一羣孩子們中間,新中國的締造者之一、國家名譽主席宋慶齡先生出現了,“她”用滬語講述了她生前發表的最後一篇文章《願小樹苗健康成長》。
這是出現在3月23日晚上,由中福會主辦的紀念宋慶齡誕辰130週年音樂會上的一幕,這也是宋慶齡數字人首次出現在大眾視野中。通過超寫實數字人,觀眾們跨越時空,感受宋慶齡先生的温暖面容。
數字人,已經不再是虛擬世界中的專屬,也不再是僅供遊戲娛樂的角色,其已經成為一個產業。伴隨着上海發展元宇宙的腳步,在影音娛樂、文化旅遊、虛擬客服、教育培訓等領域,都可以看到數字人的身影。
去年,《上海市培育“元宇宙”新賽道行動方案(2022—2025年)》發佈,計劃到2025年“元宇宙”相關產業規模達到3500億元,數字人成為上海發展元宇宙賽道上的“先發優勢”,上海的數字人產業和技術發展正在經歷着從偶像型虛擬數字人到服務型數字人的轉變升級過程。

帶來一場效率革命
2012年,虛擬歌手洛天依誕生時,數字人還是以虛擬偶像IP化為主。2020年以後,隨着3D、智能化、虛實交互等技術的成熟,數字人開始轉變為交互服務型,如首位在國內大型新聞直播中亮相的二次元虛擬新聞主播“申䒕雅”、浦發銀行的數字員工“小虹”等。
在4月7日揭牌的上海城市數字化轉型體驗館中,《IT時報》記者看到不少企業的數字人在各自的“崗位”上迎接參觀者。
“你能唱首歌給我聽嗎?”感覺到有人站在她面前,上海元集之智能數字科技有限公司打造的一款身着白色旗袍的數字人立刻在屏幕上動了起來,聽到記者的詢問,她立刻用甜美的聲音回答:“好的,你想聽什麼歌呢?”
當然,數字人不是用來被“調戲”的,上海元集之智能數字科技有限公司CEO陸文斌告訴《IT時報》記者,在金融、醫療、教育、直播等領域,數字人都在一定程度上解決了人力和效率的問題。銀行大堂裏,數字人可以代替大堂經理引導來辦理業務的用户;在直播間,數字人主播既可以一邊口播,也可以識別屏上用户的留言並實時互動,並且連續播上24小時也不會累。
在陸文斌看來,之所以數字人可以從事服務性、交互性的工作,得益於語言識別技術的發展和成熟,現在數字人對語義的理解可以稱為強悍。“以前AI需要非常具體的指令,但現在AI聰明多了,‘你要把客户照顧得妥妥的’,以前AI肯定不理解什麼叫‘妥妥的’,現在可以理解一些比較抽象的要求。”
在這背後,是超大數據庫的訓練,訓練一個數字人比訓練一個真人的數據量要大得多,同時對數字人可以進行多元化、多學科知識點的訓練。比如在培訓領域,把培訓內容“灌輸”給數字人,數字人就可以代替真人進行培訓,讓培訓者降本增效,釋放時間。

天貓超級品牌日數字主理人AYAYI
天貓超級品牌日數字主理人AYAYI、萬科總部最佳新人獎得主數字員工崔筱盼……他們不僅不拿工資、全年無休,還能大幅提升工作效率,降低出錯率。去年10月,集數字人、閲讀機器人、智能書架等為一體的上海首個“智慧圖書館”長寧區圖書館開門迎客,一個名叫“馨葉”的數字人小姐姐有條不紊地為讀者解答長寧區圖書館的信息,還“無償”提供圖書借閲服務。
領悟時代數字研究院首席研究員唐樹源向《IT時報》記者表示,數字人會帶來一場效率革命,比如在企業傳統重複性勞動的環節中,數字人就可以代替員工,讓員工去從事更有價值的事務,提升企業的生產效能和形象。
陸文斌告訴《IT時報》記者,目前很多企業對數字人的接受度較高,他們非常看重降本增效,數字人在一定程度上解決了一些痛點。

為數字人注入靈魂
如果説一開始虛擬數字人憑藉動漫式的外表吸引注意,那麼現在,數字人也正在從打磨“好看的皮囊”進化至擁有獨特的精神和靈魂,真人數字人在一定程度上讓數字人擁有了精神。
比如通過宋慶齡數字人,可以感受到這位偉大的愛國主義戰士的人格魅力。宋慶齡數字人制作團隊開天工作室相關負責人告訴《IT時報》記者,由於可供參考的照片、音頻資料非常有限,製作團隊探訪多地,從近千張影像照片中選取出了最經典、最清晰、形象特徵最鮮明的一組照片做參考,並基於SFM(Structural From Motion)算法,還原出3D模型。“通過數字資產全鏈實現數字化還原,涵蓋兩塊核心技術:數字資產(人物設定、模型)和資產驅動(綁定、動捕、驅動、AI算法),不僅考驗在有限史料下,對人物形體、造型比例的極致還原,深究人物的神韻,要實現技術與藝術的平衡與融合。”

如何在儘可能還原和復現宋慶齡原貌的基礎上,讓數字人以更好的風貌神韻呈現出來,是最大的挑戰。“人的面部肌肉很多,連帶的運動也極其複雜,很多理論上‘自然的表情’放在數字人臉上,就會失真。當前市面上通過面部捕捉形成的數字人視頻,表情精細度和寫實度,仍然需要結合領先的實時渲染技術,才能達到最好的狀態。”開天工作室相關人士説。
由北京廣播電視台、《北京時間》共同打造的“時間小妮”,是以北京廣播電視台主持人春妮為原型的中國首個廣播級智能交互真人數字人。通過人工智能、深度學習、卷積神經網絡學習技術,將春妮自然朗讀的7000個句子和形象表情進行影像採集和智能處理,讓計算機製造出真假難辨的“數字人”,形象氣質、語音語調、口唇表情、肢體動作跟真人的相似度達到97%。
據《IT時報》記者瞭解,目前,生成一個寫實數字人的成本大約在幾十萬到上百萬元不等。
“真人數字人需要更多的技術,如對真人的形象、聲音和動作構建真實人物的數字模型,提取或積累真人面部和身體運動的3D4D數據、語音數據等進行動態表情、動作的構建與遷移,進行渲染。”薩摩耶雲科技集團首席經濟學家鄭磊向《IT時報》記者解釋,為了實現高精度的細節重現,需要大量數據和計算,目前成本還非常高。真人數字人需要美術、計算機、AI等多領域的人才和技術儲備,暫時還不會大範圍商用。

數字人人才受追捧
IDC在2022年6月發佈的《中國AI數字人市場現狀與機會分析》報告顯示,到2026年,中國AI數字人市場規模將達到102.4億元。
有數據顯示,截至2022年11月24日,中國數字人相關企業總量超4500家,其中2022年新註冊企業數量超1200家,創歷史新高。
目前的市場價值決定了數字人越來越受追捧,“虛擬主播、虛擬偶像、影視的核心價值是美術能力,通過技術讓細節更逼真、更靈動;數字人客服的價值在於能否真正幫人解決問題。”開天工作室相關人士表示。
“未來的趨勢是數字人會越來越聰明,更懂、更像真人,每個企業對於數字人的開發側重點不同,有的側重數字成像,有的側重應用場景,有的關注數字人和AI的結合,我們更看重應用場景。”陸文斌説。
作為元宇宙的組成部分,數字人在製造效率、使用場景和分析決策層面,都有望迎來新的突破口。
但是,數字人的發展目前受到技術、人才、法律等方面的限制。以人才為例,很多數字人企業對於人才的需求量比較大。“數字人技術發展快,很多技術並非現成的,也沒有經驗可循,很難找到有經驗的技術人員,行業內的人才爭搶比較激烈。”陸文斌向《IT時報》記者表示。
數據顯示,2021年,上海人才總量達675萬人,其中,數字化人才佔比12.94%,位居北、上、廣、深、杭五大數字化轉型引領城市首位。
“上海有許多大學,不僅提供了温暖的孵化場地,還為元宇宙發展培養了大量人才。”影眸科技大數據項目一位管理人員曾告訴《IT時報》記者,公司大部分人才都來自上海高校,甚至還有些員工一邊讀研一邊工作,可以直接將學校最新技術運用到實踐中。
唐樹源向《IT時報》記者表示,未來數字人面臨的風險主要是技術和內容,技術上要做到安全可靠、不侵犯相關知識產權;內容上不違背倫理道德,不侵害國家社會公共利益和他人合法權益。
排版/ 季嘉穎
圖片/ IT時報 天貓
來源/《IT時報》公眾號vittimes