重新定義主播:看AI小姐姐如何乘風破浪_風聞
大白商业评论-大白商业评论官方账号-新商业观察者。2020-06-28 10:36
從6月開始,湖南娛樂頻道播出了自制綜藝節目《乘風破浪的姐姐》,吸引了很多宅男的目光,想要一睹那些過氣女神的芳容。節目沒有在湖南衞視播出,而是選擇了一個地面頻道,擺明了就是告訴觀眾去芒果TV大火箭刷起來。
有一些姐姐,像金晨、藍盈盈、沈夢辰,對於90後來説還是很上眼的小姐姐;像萬茜、許飛、吳昕、黃聖依這些對我們80後來説,也能算是姐姐。可是伊能靜、鍾麗緹、寧靜這些女星,是誰的姐姐呢?她們應該是“乘風破浪的大姨”才對。
不過,節目打造的價值標籤倒是政治正確,女性的獨立、奮鬥、個人魅力,30+的姐姐(阿姨)們以一種重新打包的形象出道,光是故事就足夠感人了。不管姐姐們的過往有多麼輝煌,都要接受評審的公開打分,從聲樂表現力、舞台表現力、成團力和個人特質四個角度來評判,這樣嚴格的標準、毒辣的眼光,姐姐們要“重新出道”真是不容易。
在端午節前幾天,網上也有一位小姐姐出道了,一位相貌古典的姑娘穿着漢服,在視頻裏為觀眾表演繞口令。(加一段表演)。仔細一看,這位小姐姐不是真人,而是AI合成的主播。原來是京東數科發佈了新的AI主播形象,你看人家京東數科玩的多高級,整個AI主播報菜名,可甜可鹹,互聯網果然套路深哪。
其實類似的AI主播視頻,國內外已經有不少巨頭科技公司嘗試過。這些AI小姐姐出道的時間有先後,她們的顏值和舞台表現力也各不相同,今天,我們就客串一把科技評審,用乘風破浪的標準來給AI小姐姐們打打分,如果組建AI主播天團該有哪些姐姐入選吧。
2016年AlphaGo擊敗了圍棋世界冠軍李世石,引發全球對AI的關注,這一年也被稱作人工智能元年。但是這個元年並不是真正的第一年,首先要交代一個背景,我們今天看到的各種AI技術繁榮,已經是人工智能概念提出以來的第三波浪潮。這波浪潮能在2016年興起AlphaGo只是表象,它的真正原因是,移動互聯網把現實世界高度數據化。有了數據,才能訓練出人工智能,所以它是客觀條件成熟之後自然發展起來的。
2016年油管上出現了一位名叫“絆愛”的虛擬主播,她是由日本漫畫家森倉圓創作出來的二次元小姐姐。(加一段視頻)絆愛面世之後,她還出現在日本的很多電視節目、動漫作品和遊戲裏,在小破站也圈了許多粉。
雖然絆愛的聲樂表現力、舞台表現力還不錯,贏得了不少觀眾緣。但如果仔細看就會發現,絆愛其實是把真人演員的動作捕捉用到了3D模型上,而且絆愛的聲音也完全是演員配的,所以這個形象只有人工,沒有智能,不能算是AI主播。成團力和個人特質0分。總分40分。
在合成AI主播方面,搜狗可以説是中國軍團的老師傅了。2018年互聯網大會期間,搜狗和新華社聯合發佈了首個AI合成主播,這位1.0版本的AI主播當時只能動嘴唇,面部表情和四肢看起來還不太協調。
到2019年2月,搜狗又發佈了2.0版本站立式的AI主播,增加了一些手勢肢體動作,也解鎖了更多的身體姿態。搜狗的“分身技術”得到進一步提升。
2020年5月搜狗發佈了3D合成的AI主播“新小微”,這位主播可以在畫面中走動,這説明搜狗的圖像合成技術有了新的突破。新小微在今年兩會期間亮相,播報兩會的新聞資訊。搜狗的AI主播全都採用了新華社真實記者的形象,也成為一大亮點。
好了,下面進入點評打分環節。我們就把今年最新款“新小微”作為搜狗的代表。首先,她是一個3D主播,而且能在畫面裏行走,全身動作也比較協調,所以在舞台表現力上獲得了滿分。聲樂表現力也非常不錯,AI的聲音非常流暢,也獲得高分。但是“新小微”的形象有點讓觀眾失望,一看就是3D動畫,距離真人小姐姐差距較大,也很難給觀眾留下深刻印象,所以個人特質方面分數較低。總分80分。
下一位選手來自安徽合肥的科大訊飛。2019年3月科大訊飛推出AI主播小晴,這位AI小姐姐不僅顏值高,還精通多種語言,播報時可以在中文、日語、英語、韓語等多語種裏隨意切換,還可以説出全國各地的主要方言,並且發音準確,十分專業。
2017年國家發佈了一批新一代人工智能開放創新平台,科大訊飛成為智能語音平台。他們在自然語言識別方面積累了不少技術成果,也變相獲得了官方認證。但科大訊飛在圖像處理層面相對較弱,比如2018年同樣是合作的虛擬主播“康曉輝”,就把康輝的形象做的不忍直視。
下面對AI主播小晴打分,會説多門外語,有一技之長,聲樂表現力滿分。其他三項的表現一般,總體得分70分。
接下來開始表演的,是剛才提到的京東數科。今年5月京東數科發佈了AI主播“小妮”,從視頻畫面來看,小妮和這次發佈的“小可”表情細膩,色彩還原精度高,肉眼很難分辨出到底是AI還是真人。這主要得益於京東數科把2D模型和3D模型做了打通,將傳統方法和深度學習進行了結合。
簡單地説,3D模型的追蹤技術可以保證AI主播在説話時口型準確、表情細膩、頭部運動自然,而2D模型能生成更細膩的畫質,京東數科打通了這兩種模式的壁壘,所以做出來的AI小姐姐才更加真實。
視頻中,小妮的聲音聽起來比較自然,京東數科採用了輕量級對抗語音合成技術。我們做一點簡單科普,把信息從文字轉化成語音,人工智能就要像個孩子一樣去模擬真實主播的聲音,可是AI怎麼知道自己模擬的像不像呢?對抗語音合成技術是一種機器學習的方法,它造出生成器和判別器兩個部分,自己監督自己。前者生成語音,判別器負責把那些跟樣本聲音不一樣的分辨出來。
這兩個東西相互博弈,相互對抗,就像軍事演習裏的紅藍雙方一樣,模擬對抗自我提高。這個技術可以優化AI主播的音色,甚至模擬出人的呼吸和換氣,也能大幅提高音視頻的生成速度。
通過視頻可以發現,小妮和小可的身體動作比較少,也無法移動,説明京東數科的多模態AI技術還在進步當中。當然,京東數科能在短時間內發佈相對成熟的AI主播,已經躋身到AI技術巨頭當中。
我們給“小可”打分,小可的聲樂表現力和個人特質表現優異,但是成團力和舞台表現力還相對欠缺,總分80分。
除了這三家主力之外,BAT也都做過虛擬主播。騰訊最近推出“馮寶寶虛擬直播”,為自己的一款遊戲造勢;淘寶的首位虛擬主播也在這個月出道,二次元主播“賽門”在淘寶上直播賣貨;百度大腦的AI虛擬主持人小靈,2019年曾經登陸央視。這三家公司的AI主播,都採用了虛擬IP,形象設計總覺得哪裏土土的,就不把他們當做參賽選手了。
總體上説,搜狗的“新小微”出道較早,技術成熟,而京東數科有後發優勢,在聽覺、視覺和語言三個方面快速積累了深厚經驗,兩家得分旗鼓相當;科大訊飛稍遜一籌,但也具備了相當的實力。這三家公司他們總體上代表了中國在唇語識別和合成技術上的水平,三家可以組成一個多模態AI技術的中國天團了。
其實,AI主播只是給普通人刷新認知打了一個樣,它背後的技術有很高的落地使用價值。比如,人工客服的成本很高,質量也參差不齊,用AI小姐姐來代替人工客服,可以提升客服效率。再比如,在招聘場景中有很多重複的基礎性問題,AI小姐姐同樣可以温柔的向虛求職者提問,有效節省人力。甚至AI主播真的替換掉一些媒體主播崗位,也可以替換掉直播帶貨的主播,24小時不吃不喝不斷電。
2001年一家英國科技公司,推出了世界上第一個虛擬主持人阿娜諾娃,雖然這個形象今天看起來無比山寨,但媒體還是把她描述成“堪比有血有肉的主播。”2004年央視推出了一個男性虛擬主播。據説,這個形象從策劃到實際製作,歷時一年花費上百萬,引起了觀眾的轟動。
技術的飛速進步消解了我們對AI的神秘感。比如,京東數科的AI主播,只需要幾小時就能合成新內容。以至於當我們看到跟真人無比接近的AI主播時,反而沒有那麼激動了,因為AI真的走進了我們的生活。可這一切,距離千禧年不過十多年時間。所以説,不要高估了技術的短期影響,更不要高估了技術的長期影響。