押注數字人,百度、科大訊飛“短兵相接”_風聞
刘旷-公众号ID:liukuang11007-05 11:03
配圖來自Canva可畫
近兩年,小雀斑、柳夜熙、AYAYI等大量網紅數字人的相繼出現,以及虛擬數字技術在《指環王》和《阿凡達》以及《刺殺小説家》等電影中的廣泛應用,還有北京冬奧會期間數字人在手語解説、節目直播等眾多場合亮相,使得公眾對數字人的認知上升到了一個新的台階。
作為數字經濟的重要環節,數字人為數字經濟的發展注入了新的動能。於是,各個行業企業便湧現出了多個玩家,紛紛基於已有的相關技術和業務基礎,開始進軍數字人賽道,數字人行業也由此迎來了一波新的發展熱潮。
數字人乘風而起
隨着數字人在各行各業中的應用越來越廣泛,國內數字人市場規模也在持續穩步增長。根據IDC在《中國AI數字人市場現狀與機會分析2022》報告中預計,到2023年中國AI數字人市場規模將達102.4億元。而數字人市場之所以將呈現高速增長的態勢,則與三大利好不無關係。
從政策層面來看,國家政策的大力支持,預示着數字人的前景一片大好。近年來,國內虛擬現實相關產業備受外界關注,自2016年起,國家就發佈了多項政策支持我國虛擬現實產業的發展,並將虛擬現實和增強現實與雲計算、大數據、物聯網、工業互聯網、區塊鏈、人工智能一起列為了數字經濟重點產業。而虛擬數字人作為虛擬現實產業重要的應用之一,自然也有望享受到政策利好所帶來的紅利釋放期。
從技術層面來看,數字技術的融合發展,驅動了數字人進入發展快車道。其實數字人出現的時間並不算晚,只是受技術應用水平的限制,早期的數字人制作週期長且成本高。而近幾年,隨着CG、語音合成、深度學習算法、自然語言處理等技術的進步,數字人各環節制作週期大大縮短、製作成本明顯降低,數字人制作也走向了智能化。堅實的技術基礎,不僅創新了數字人行業的發展應用,更是加速了數字人場景化的應用落地。
從環境層面來看,AIGC技術的逐漸成熟,助力了數字人行業規模的拓展。數字人雖然最初多應用於影視、遊戲等行業,但隨後應用場景將會不斷拓展。只不過,越複雜的環境對數字人的信息處理能力、即時互動能力,以及表達能力等都有着更高的要求。而在AIGC的賦能下,數字人內容生產流程將有望得到創新,可助力數字人廣泛與各行業領域相結合,為數字人描繪出了極大的創作及交互想象空間。
在政策、技術、環境的多輪驅動下,數字人應用場景將持續得到拓展與深化。而隨着數字人行業進入高速發展期,國內也已出現了諸多相當有競爭力的玩家,這其中,以百度為代表的綜合類互聯網技術廠商,以及以科大訊飛代表的專長類AI廠商的表現最為突出,優勢也最為明顯。
百度“雙輪驅動”
目前來看,數字人雖然已經應用於多個領域,但當前市場上大多的數字人產品精度依舊較低,而百度不僅上線了具備較強的視覺感知和動作控制能力,能夠通過手勢、語音等方式與用户進行互動的虛擬數字人,還搭建了百度智能雲曦靈智能數字人平台,提供虛擬形象智能交互解決方案,而這些產品的生成,都源於百度為數字人相關開發提供了絕佳的土壤。
一方面,百度在AI技術上的領先優勢,能夠高效率、高質量地推動其數字人技術的迭代升級。眾所周知,數字人的發展離不開計算機視覺、智能語音、自然語言處理等AI技術的支持,而作為國內唯一一家既有視覺能力,又有語音、語義相關包括計算機圖形學自動生成全鏈路AI能力平台型的公司,百度已經積累了大量全棧AI能力,而這無疑是其數字人成功落地的實力與底氣。
另一方面,百度標準化、平台化的優勢,可以有效降低運營門檻,助其數字人實現廣泛應用。想要實現“人均一個”數字人,產品標準化、平台化必不可少。得益於百度在視覺、NLP、語音交互等底層全棧AI技術優勢的長期積累,以及PLATO百億參數對話大模型,百度智能雲已經將這一能力平台化、標準化,這不僅使其部署成本更低,週期更短,還可以做到一次部署、一次建設,並在多個場景下形成虛擬數字人能力,實現端到端軟硬一體的商業應用。
百度憑藉無可比擬的AI能力,加之在標準化、平台化中服務穩定、成本低廉等特點,在數字人領域先發制人,在產品力、市場上走在了行業前列。據瞭解,百度智能數字人平台是世界上首個在線語音交互注意力模型,實現與數字人自然暢通交流,高準確度的音畫同步,逐字口型準確率>98.5%。另外,目前百度終端虛擬人產品,也已經以智能客服的形象,成功落地在了深圳、重慶、鄭州等多個城市的各大地鐵站,全天候為來往的乘客提供最便利的智能諮詢服務。
科大訊飛“三線出擊”
數字人已經成為多家廠商發力的重點,凡是進入的玩家都在機器視覺、語音交互和自然語言處理等方面有着或多或少的技術積累,而儘管國內諸多互聯網大廠和科技巨頭都瞄準了數字人賽道,但作為亞太地區知名的智能語音和人工智能上市企業,科大訊飛同樣在推動數字人產品和場景應用落地上,建立起了自己的優勢。
一是,科大訊飛所具有的豐富的技能和問答知識儲備,可以讓其數字人變得更加聰慧智能。一直以來,科大訊飛都在致力於讓機器“能聽會説,能理解會思考”,其開發的星火大模型不僅在開放式知識問答上取得了突破,其多輪對話、邏輯和數學能力也有所升級。而科大訊飛語言理解、知識問答、邏輯推理等各項能力的持續提升,能夠使其數字人準確地理解用户問題,並給出自然、準確的回答,為用户帶來更為豐富的使用體驗。
二是,科大訊飛在智能語音技術方面的深厚積澱,可以為其數字人的落地提供全鏈路保障。科大訊飛自成立以來,就一直從事着智能語音、自然語言理解、計算機視覺等核心技術的研究,並且其在語音、圖像、自然語言理解、機器認知推理能力、多語種多模態人機交互等方面的技術和產業化應用已具有業界領先水平。得益於此,科大訊飛的數字人也就能得到語音識別、語義理解、語音合成、形象驅動、視頻渲染服務的全鏈路保障。
三是,科大訊飛專屬的數字人定製能力,有助其在眾多廠商中形成差異化優勢。科大訊飛可以根據客户要求,在客户的不同業務場景下進行AI虛擬人賦能,為客户提供一站式、定製化AI虛擬人服務。比如,在服務部署上,可以靈活採用公有云或私有云的部署方案,保障交互服務的安全穩定;在形象聲音上,可以根據客户音色、風格的需求靈活定製專屬的個性化語音庫;在虛擬人形象上,可以支持2D真人形象,從而為客户定製專有IP形象。
仍需負重前行
在數字時代,數字人已經開始在各個企業中扮演關鍵角色。然而對於數字人企業而言,打通產業鏈各環節、修煉技術“內功”,才是打造競爭優勢、強化競爭壁壘的關鍵。因此,即便是國內數字人發展較為成熟的公司,已經在客户積累、技術實力、銷售渠道、資金供給等方面具備了一定積累,但由於數字人行業天花板依舊較高,想要維持長期和衍生發展並不容易。
一方面,國內數字人尚處於起步階段,距離商業化規模推廣仍有一定距離。儘管國內諸多企業的數字人已經實現了場景化應用,但就整體而言,我國數字人行業發展仍處於起步階段,不僅尚未跑出一個覆蓋全產業鏈的數字人企業,大多數企業在數字人情緒感知、語義理解、情感連接等方面仍有所欠缺。另外,國內各家數字人在細分市場上的產品也都還仍處於試驗可行性的階段,大規模商業化暫時還難以實現。
另一方面,海外巨頭的數字人優勢明顯,國內企業想要追趕還需更加努力。國內領先企業的數字人產品雖然已經頗具特色,但國內企業更側重AI技術的開發與內容應用,因此數字人產品大多探索的是其在社交活動、新聞媒體、文旅等領域的應用。而海外巨頭多聚焦於數字人的基礎建設,技術優勢較為明顯。比如英偉達、Unity等均基於自身技術優勢向下遊生產技術服務平台延伸,相較於國內,其技術壁壘就更為深厚。
目前來看,國內以百度、科大訊飛為代表的科技企業在數字人上的探索雖然還有一定難度,但值得注意的是,在各個大廠的不斷髮力,以及人工智能技術的大力加持下,數字人的製作運營效率有望得到持續優化,其應用價值也將得到不斷釋放。而隨着百度、科大訊飛不遺餘力地加速數字人的進程,其數字人的未來也將會非常值得期待。