未來AI產業走向求解,大模型加持的數字人能否成就大業?_風聞
AI产业研究中心-10-12 09:50

圖片來源@視覺中國
文|AI產業研究中心
在杭州舉辦的第19屆亞運會,剛剛拉下帷幕。如果説與往屆亞運會相比,本屆亞運會最大的亮點是什麼?那非是數字人技術在亞運會期間的廣泛應用莫屬。
先是在開幕式上,首次出現了“數字人點火”,由全球超過1億位線上用户參與,共同組成的一個巨大的“數字火炬手”,如蜻蜓點水般跑過錢塘江江面,奔進主會場,跟現場火炬手一同點燃主火炬,引發了廣大網友的讚歎和好奇。
作為人工智能、裸眼3D和現實增強技術的完美合體,這一次“數字人點火”,不僅開了大型運動會點火儀式數字化的先例,同時也讓數字人技術成為近期全球業內外各界熱議的話題。
“數字人”並非新事物,降本增效是“老江湖”
雖説近幾年,數字人才大量出現在人們生活中,但其本身並不是近幾年才出現的新事物。其實,世界上第一個數字人問世,距今已有近60年了,而且在這幾十年時間裏,它們一直在為我們服務。
早在上世紀60年代,波音公司就在飛機設計領域,開始使用一款名為“波音人”的數字人來充當人體工程學研究的人體模型。“波音人”不僅擁有人類的外形和常見的行為舉止,而且還能在人類設計的場景中模擬人的動作,甚至能跟外界進行交互並生成數據。基於這些數據,設計師們可以對飛機駕駛艙設計做人體工程優化,以便飛行員在駕駛飛機時,能操縱得更加得心應手。
此外,在汽車行業,數字人也很早就得到了應用。其中,很多車企就在汽車碰撞安全測試中引入了數字人技術。比如,豐田汽車就曾經開發過一款人體建模軟件“THUMS”。通過這款軟件,能夠構建出非常接近人類外形、行為和反應,且具有不同性別、年齡、體型的“數字人”司機或乘客。用其做碰撞測試,不僅能收集到更加全面的信息,還能在確保測試效率和準確性的同時,最大限度降低測試成本。
可見,對於產業界而言,數字人本身並不新鮮,真正新鮮的是隨着成熟人工智能技術的加持,數字人實現了智能化。而今天的數字人,也已經從早期的對於人類外形和行為動作的單向模仿,升級為對於人類思維模式的模仿、內容生成和交互輸出。
今“數字人”非彼“數字人”
近兩年,隨着生成式AI技術的高速發展和應用普及,我們已然走進了與數字人共同生活的時代。從技術層面來講,今天的數字人跟早期的類似於“波音人”的數字人相比,還是有很大的區別的。
波音和豐田所開發的數字人,基於應用角度來看,只能算是用來做數據採集的模擬人體,頂多算是一種簡單的人的數字孿生,説是數字人就顯得有點牽強。
就定義而言,按照中國人工智能產業發展聯盟發佈的《2020虛擬數字人白皮書》中的描述,虛擬數字人必須要滿足以下三個標準,即一要擁有2D或3D的人類外觀;二要擁有如語言、表情、動作等的人類行為;三要擁有人類的思想,比如識別、交互等能力。
而按照這個標準,像“波音人”、用豐田“THUMS”軟件打造的數字人,就不能算作數字人,因為它們不僅沒有人的外觀和行為,也不能識別外部環境且與人交互。而今天的數字人,則能夠具備逼真人類形象和人工智能。
比如,利用AI語音生成技術和逼真的表情、動作生成技術,能讓數字人在交流、演講和播報中更富有表情和感染力,另外通過大語言模型的加持,也讓數字人具備了可以根據用户留言而給予相應回應的能力,而“數字患者”、“數字健康顧問”的出現,也讓數字人能為用户提供仿真的醫療場景。
自2022年起,國內很多企業就已經成為智能客服技術應用的“弄潮兒”,開始“僱傭”數字人員工了。當你在線跟企業客服人員溝通,或者登錄企業線上營業廳,辦理各項業務的時候,在另一邊跟你對話打交道的,就很有可能是一個數字人。
在今年7月舉辦的“2023世界人工智能大會”期間,上海市經信委、上海市產業技術創新促進會聯合深蘭科學院共同發佈了國內第一份《2023數字智能產業系列報告:個人數字化》白皮書。該白皮書就提出了數字人的發展分為內容數字化、人的數字化和生命數字化三個階段,並從個人的數字交互、數字孿生、數字存儲這三個維度,展望了數字人產業發展的前景。
由此可見,今天的數字人產業,儼然已經站在了數字經濟產業舞台的C位。
近階段爆火的“數字人”,你都知道哪些?
在AI科技迅速發展的大環境下,數字人作為典型代表產物,其商業化也進入了快車道,眾多科技企業紛紛入局。根據企查查數據顯示,目前國內與數字人產業相關的企業,數以十萬計。產品大致可以按應用、技術、呈現方式三個層面劃分,總計七大類;如按屬性劃分,則可分為

從應用層面,數字人主要分為服務型、表演型和身份型三大類。
其中服務型數字人強調的是功能屬性,主要是為大眾提供各種服務,如虛擬客服、主播、導遊等,也包括具有陪伴、關懷價值的虛擬助理、顧問等,基本面向B端客户,主要起降本增效、助力營銷的作用。
如2022年,商湯科技為寧波銀行專門打造的數字員工“小寧”,就屬於這一類數字人。據介紹,“小寧“是基於商湯原創的“虛擬IP解決方案”及多種領先的AI技術打造的,可以自主從事直播、運營及互動,實現了全天候的“用户觸達”。而深蘭科技為武漢江漢路步行街智慧化升級項目打造的數字主理人“江妮”也屬於這一類。
表演型數字人強調的是偶像屬性,當前主要是被應用在娛樂、社交、辦公場景中,如各類虛擬偶像、明星虛擬分身等,相較於服務型數字人,其更具流量吸引力和商業想象空間。
在今年大年初一《廣東衞視春節晚會》上,與鍾鎮濤、炎明熹一同演唱歌曲《財神到》的陳水若,就是基於AI平台“小冰框架”生成的一位擅長中國風曲目的AI數字歌手。
而身份型數字人則是強調身份屬性,即現實世界中的“真人”在虛擬空間、元宇宙中的ID,也被稱為個人數字分身。不同於前兩種數字人,身份型數字人主要面向個人用户,其瞄準的也是最具市場想象力的個人數字化產業,當前主要用於社交、辦公等場景,未來具有廣闊的應用場景和發展前景。
在前不久召開的“ 2023‘科創的力量‘無疆首屆高新科技產業資本峯會”上,宣佈在全國範圍內招募合夥人的“深蘭硅基大腦SaaS平台”,就是深蘭科技基於硅基知識大模型開發的一款服務於個人數字化的數字人生成產品,它可以記錄個人的日常數據,並用於數字人的領域知識和個性化人設等高維定製化訓練。用户通過該平台快速構建的ChatGPT級別AI數字人,就屬於身份型數字人。
從技術層面,數字人則可以分為真人驅動型和智能驅動型兩大類。
真人驅動型數字人是採用“CG建模+真人動作捕捉”方式構建,在完成建模和關鍵點綁定後,數字人可以通過設備捕捉真人的動作、表情、語言等,並以此為驅動,完成相應表演、互動。其可以看作是傳統影視製作CG技術的延續,強調“人機耦合”,技術相對成熟,尤其隨着近些年算法進步以及高清動作捕捉設備的使用,攻克了在穩定流暢地捕捉和展示真人微表情、微動作上的技術難點,這使其成為當前最常用數字人。如使用騰訊智影視頻生成平台塑造的數字人,就是屬於這一類。
智能驅動型數字人,則是依託多模態大模型技術來驅動眼、眉、嘴等人體部位,以此讓數字人展現出比肩真人的動作、表情乃至記憶、思想等,形成獨特“人設”和技能,自主完成內容輸出以及與外界互動。該類數字人主要基於知識圖譜進行服務,目前大都以“工具人”身份出現,例如虛擬客服、虛擬助手、虛擬導遊等。
單就技術而言,由於完全智能驅動型數字人在人設、思想、記憶及主動互動與輸出等方面,有着很高的技術要求,因此開發這一類數字人的平台,大都還處於技術攻堅階段,只有少數企業取得了突破性進展,而那些真正有部分認知能力且可實現智能交互的數字人,也是最近才開始商用的。前面提到的通過“深蘭硅基大腦SaaS平台”打造的數字人,如果按技術層面來劃分,也可以劃歸這一類。
從呈現方式層面,虛擬數字人主要分為卡通型和超寫實兩類。
卡通型數字人突出的是虛擬屬性,其雖然具有語言、動作、表情等人的行為模式,但它的一切皆為虛構,在現實世界中根本不存在。這一類數字人其實從動畫影視出現那天,就已經出現了,它的優勢主要體現在易製作、產量大、成本低上。因此,目前這一類數字人主要還是出現在二次元、遊戲、卡通動畫中。
而超寫實數字人突出的則是數字資產屬性。作為當前數字人主流發展方向和未來個人鏈接元宇宙場景的重要工具,其從一開始就繞開了“二維”和“卡通”,通過精細設計並由技術合成,且自帶高清人物建模以及專屬服飾和場景,為的就是儘可能貼合現實世界中的真人形象。
如在2月召開的“2023全球人工智能開發者先鋒大會”上,以AIGC首席架構師身份發表演講的百度AI數字人希加加;使用商湯“如影”平台打造的個人數字分身;用户通過每經科技自主研發的“雨燕智宣”平台生成的數字主播等,都屬於超寫實數字人。
而如果按照產品屬性來劃分的話,則可以分為成品和工具平台兩大類。像AI歌手陳水若、百度AI數字人希加加、寧波銀行數字員工“小寧”等屬於成品類產品,而像“商湯如影”、“深蘭硅基大腦SaaS平台”、每經“雨燕智宣”這樣的,則屬於是工具平台類產品。

數字人和數字人生成平台舉例
“數字人”脱胎換骨,“數智人”呼之欲出
總的來説,國內數字人產業目前正處於加速發展期,越來越多的科技企業在這一領域佈局,越來越多的數字人產品在各行各業落地,整個產業呈現出一片欣欣向榮的發展局面。據前瞻經濟學人預計,2027年市場體量或達到300億元,2022-2027年行業整體年複合增速或達到30%。
當前,AI技術驅動多模態輸入感知、多模態交互能力不斷完善,ASR、NLP、TTS、STA、情感計算等技術已經取得突破,數字人已經開始擔負起連接人與AI的新型交互接口的角色,成為元宇宙中各類“人”與事物之間產生聯繫或發生孿生關係的新介質。
因此,像虛擬IP與虛擬化身這兩類身份型數字人,它們在內容創新空間和應用開發潛力上的優勢將更加明顯,有望在電商、直播、營銷等領域得到廣泛應用。
未來,隨着數字人所具備的人的形象、性格、行為特徵以及類人的互動能力不斷提升,大模型技術的不斷加持,數字人將進一步向具有人類意識的“數智人”方向發展。在不改變業務邏輯的情況下,“數智人”可以與更多的行業場景進行深度結合,產生千行千面的數字人業態,從而向用户提供更好的陪伴。
總而言之,雖説現階段數字人產業仍處於發展初期,但未來隨着技術的突破、應用門檻的降低,市場體量的增大,數字人必將走進我們的生活,走進千家萬户。
正所謂:一切皆有可能,萬事皆可期待。