谷歌的AI有意識,中國的AI“懂開車”?_風聞
深燃-深燃官方账号-聚焦创新经济,专注深度内容。2022-07-22 00:02

深燃(shenrancaijing)原創
作者 | 王敏
編輯 | 向小園
不久前,谷歌一研究員爆料AI有意識的事件剛上熱搜,今天,2022百度世界大會上的一個小插曲,再度引發大家對AI的討論。
7月21日上午,2022百度世界大會官方視頻號直播突然被中斷,隨後緊急恢復。有不少網友調侃,可能是直播中提到無人駕駛,一直在説“開車”,被AI判定為違規。
這當然只是一個玩笑,但“AI已經具備人格,要意識覺醒了”似乎是AI發展歷史上的永恆話題。長期關注AI的朋友都知道,這還很遙遠,但其實,AI的創作能力已經到了開始搶人類“飯碗”的地步。
這次“百度世界大會”上,百度創始人、董事長兼首席執行官李彥宏分享了對於AIGC的思考,讓AIGC的概念備受關注。
什麼是AIGC?李彥宏指出,AIGC(AI generated content,AI生產內容)是繼UGC(用户生產內容)、PGC(專業生成內容)之後,全新的內容生產方式,不僅能提升內容生產的效率,還能創造出有獨特價值和獨立視角的內容。
伴隨着元宇宙、Web3概念的走紅、下一代互聯網的演進,用户對於內容的需求越來越旺盛,內容產業迫切需要升級迭代,AIGC也隨之越來越被需要。
在這屆以“AI深耕,萬物生長”為主題的百度世界大會上,百度展現了以AI修復殘畫《富春山居圖》的能力,這只是百度基於文心大模型AIGC能力的嘗試之一。百度AI虛擬人度曉曉、希加加的對話、跳舞、作畫、作詞作曲的實現,也都離不開百度的AIGC能力。
有業內人士指出,看似遙遠的AIGC時代已經悄悄到來,賦予了AI強大的生產力。除了百度之外,在國內市場上,互聯網大廠、AI獨角獸以及一眾創業公司都已經將觸角探入了這個前沿領域。以AI能力為基座,一場面向下一代互聯網的較量已經悄悄開始。
那麼,百度的AIGC長什麼樣?背後的AI技術發生了怎樣的變革?百度在這種爭奪戰中處於什麼位置?本文試圖回答這些問題。

全能AI來了?
在百度世界大會現場,一幅AI修復的《富春山居圖》緩緩展現在人們眼前。
元朝畫家黃公望的這幅《富春山居圖》,自明朝末年遭火焚斷為上下兩卷後,後人再也無法得知缺失的部分。AI彌補了這一缺憾,不僅補全畫作,還在畫上題詩一首。就連黃公望紀念館負責人毛傳鑌也説,這幅AI修復版名畫“與現存真跡風格一致”。

百度利用AI技術補全《富春山居圖》
AIGC的修復能力強大,效率也非常驚人。大會現場,主持人撒貝寧還在百度APP上,勾勒幾筆,通過AI技術補全這幅名畫,體驗了一把AI修復。同樣,每個人都可以對這幅名畫進行AI修復,一千個人,就有一千個版本的修復版《富春山居圖》。
當然,AI作畫只是百度AIGC藍圖裏的早期階段,結合百度對於AIGC領域的探索,李彥宏在大會上判斷AIGC將走過三個發展階段:第一階段是AIGC的“助手階段”,輔助人類進行內容生產;第二階段是AIGC的“協作階段”,AIGC以虛實並存的數字人形態出現;第三階段為AIGC的“原創階段”,AIGC可以獨立完成內容創作。
在第一階段,人們的印象大多停留在單點技術上的AIGC產品,包括AI寫詩、AI作曲、AI剪輯等。李彥宏舉例稱,他的《智能交通》一書AI超擬真有聲書版本就是利用AIGC技術創作生成的。其音頻合成效果還原度幾近他的原聲,普通用户基本無法辨別。AIGC的第三階段,由AI獨立完成從0到1的創作,當前真正意義上實現,還比較困難。李彥宏稱,AI大模型的突破正在加速這一趨勢。
這中間的第二個階段,百度的度曉曉、希加加等AI數字人用行動在過去的半年裏做了詳細詮釋。
早在2021年12月底的一場溝通會上,李彥宏就發現了AIGC概念正在走紅,談及2022年目標時表示,稱要打造一個虛擬形象,由AI完成各種動作。
於是兩個多月後,百度的AI虛擬偶像希加加正式出道。據瞭解,希加加的形象包括外形、名字、服裝、髮型等,都是AI技術生成,是AIGC的成果。而且,希加加具備語言、面部表情和肢體動作表達的能力,能夠像人一樣對話、行動,最重要的是可進行自主學習及迭代,憑藉AI能力進行創作快速生成內容。過去幾個月,希加加化身AI設計師,已經聯合發佈了多套數字藏品。
百度另一位AI數字人“度曉曉”,更是有“勞模”之稱,過去半年裏持續引領着AIGC潮流。文本創作上,她在上海高考時挑戰了40秒完成40篇高考作文,效率驚人;圖像層面,她數十秒之內創作了AIGC畫作數字藏品,24小時銷售額突破17萬,並受邀參加西安美院畢業展;音樂層面,她和明星龔俊數字人一起作詞、編曲,發佈了首個虛擬偶像AIGC單曲《每分每秒每天》。
度曉曉、希加加之外,百度AI數字人家族成員還有央視網虛擬主持人小C、理財專員小浦、文博虛擬宣推官文夭夭等。
這些AI數字人們變得能聽、能説、能理解、可互動,越來越“聰明”,近乎全能。
百度對於AIGC的佈局,遠不止打造AI數字人,更在於加速數字人的規模化落地。今年1月,百度發佈了To B的百度智能雲曦靈平台,這是一個整體上更接近全鏈路實現AIGC的數字人平台,能夠為各行各業提供數字化生成和內容生產服務,降低數字人的使用門檻。
據百度數字人與機器人業務負責人李士巖介紹,百度智能雲曦靈平台目前擁有四個子平台,分別是數字明星運營平台、數字人手語平台、數字人直播平台以及與交互能力相關的對話配置平台。以最近發佈的數字人直播平台為例,這一平台能夠生成AI主播,商家購買服務後,可以無需真人主播、中控人員、複雜硬件的支持,就能獲得24小時無休的AI主播。
在AIGC的助手階段、協作階段,百度已經成為深度玩家。

AIGC背後,誰是最大功臣?
當百度進入AIGC的第三個階段,就需要AI大模型即預訓練大模型獲得新的突破了,這已經成為近幾年人工智能技術和應用的重要方向。
以前AI深度學習訓練模型,都要進行大量的數據標註,也面臨着通用數據激增與專用數據匱乏的矛盾。AI大模型在大規模數據集上完成預訓練後無需微調,或僅需要少量數據的微調,就能直接支撐各類應用。
從2020年,OpenAI發佈模型參數為1750億的NLP預訓練模型GPT-3開始,國內外大廠們,包括谷歌、微軟、Meta、華為、阿里、百度等,就在預訓練大模型領域展開了一場“軍備競賽”,各家開始拼參數、拼算力,參數從千億到萬億甚至飆至10萬億。
百度從2019年就已開始積累AI預訓練模型技術,先後發佈飛槳深度學習開源開放平台、知識增強文心(ERNIE)系列模型。基於百度飛槳深度學習平台,百度在2021年12月發佈了全球首個知識增強千億大模型鵬城-百度·文心,參數規模達2600億。
不過,拼參數的時代正在過去。“2022年,是AI大模型產業落地的關鍵年”,百度研究院認為,2022年,超大規模預訓練模型將逐漸實用化、破除盲目增加參數規模的“軍備競賽”,呈現知識增強、跨模態統一建模、多學習方式共同演進的趨勢。
據百度首席技術官王海峯介紹,基於飛槳深度學習平台,百度在預訓練大模型領域不斷精進,目前文心全景已經發布20多個大模型,既包含基礎通用的大模型,也包含面向重點領域、重點任務的大模型。這次世界大會上,百度文心還推出世界上第一個航天領域的大模型——航天-百度·文心大模型。

產業級知識增強大模型文心全景圖
百度的AIGC能力,離不開百度文心大模型。此次大會上AI修復的《富春山居圖》,就是用到了文心大模型當中多任務統一學習的視覺大模型。文心大模型先是學習了大量的中國山水畫,從山水畫“小白”向“大師”進階,然後再針對黃公望的《富春山居圖》進行單樣本學習,掌握其精髓,從而讓補全的畫作與現存真跡風格一致。
也正是百度文心大模型,讓數字人能夠通過AI技術以自動編排合成的方式生產內容。據瞭解,百度AI數字人度曉曉的陪聊對話能力,使用的是對話生成大模型文心PLATO,其現已升級到百億參數的文心PLATO版本,在開放域對話效果上得到了持續提升。
百度數字人的畫畫能力,使用的是文心大模型跨模態圖文生成模型ERNIE-ViLG,這種圖像和文本雙向生成模型,不僅可以根據個性化需求自動化生成油畫、水彩畫、中國畫等多種風格的不同分辨率圖像,還能實現“看圖説話”的效果。
隨着大模型技術的不斷突破,百度正在加速AIGC向原創階段發展演進,一旦跨過某個奇點,就能產生真正意義上的AI原創內容。

元宇宙浪潮,離不開AIGC
2022年被不少業界人士稱為AIGC元年。
從PGC、UGC到AIGC,伴隨着AI技術的成熟,這場內容生產變革的背後,是下一代互聯網對於數字內容的數量、形式和交互性都提出了更高的要求。市場需要以更低的成本、提高內容生產效率,創作出有獨特價值和獨立視角的內容。李彥宏稱,未來十年,AIGC將實現以“十分之一的成本”、以百倍千倍的生產速度,去生成AI原創內容。
但不可否認,AIGC的概念還相對早期,李彥宏也是在一眾互聯網大佬中率先公開定義了這一概念。
觀察當前的市場可以發現,很多玩家們或許還未明確AIGC概念,但從動作上早已有所涉水,總體而言,聚焦在兩個板塊,一個是針對AI底層技術去做突破,進行內容的生成;另一個則是圍繞着數字人的形態,進行技術的整合,通過AI技術結合相關的圖形識別、視覺技術、3D建模、CG渲染、動作捕捉等技術,不斷完善數字人的個性化和交互能力。
無論哪個板塊,都有大廠和創業公司在加碼佈局。其中,在AI技術層面,國內的科大訊飛、商湯、阿里、騰訊、小冰,都長期深耕。諸如AIGC技術研發商數字力場、遊戲AI公司超參數科技等創業公司,聚焦在AIGC技術層面,都以AIGC概念獲得了融資。
而數字人賽道在過去一年可謂風頭正盛,據瞭解,單是2022年第一個月,融資已達近百起,金額超4億元。虛擬人相關公司中,一類側重於虛擬偶像、虛擬IP的內容運營,一類則是技術服務商,側重於虛擬人相關技術的融合,並輸出解決方案。參與者不乏阿里、騰訊、網易、科大訊飛、商湯這些大廠、獨角獸公司。
在這些試水AIGC的市場玩家當中,百度的特色是覆蓋領域廣、佈局深入。
和互聯網大廠相比,百度做虛擬人,已經打造出了度曉曉、希加加等虛擬IP,又搭建起了包含全鏈路AI能力、全產業鏈各個環節,從建模到綁定、到動力學等能力的平台,能實現一站式數字人服務和交付。
即便放在AI賽道上,AI積累也是百度的強項。李士巖對深燃表示,百度是國內唯一一家既有視覺能力,又有語音、語義相關能力,還包括計算機圖形學等全鏈路AI能力平台型的公司,底層全棧AI能力是曦靈的優勢。
百度對於AIGC也抱有較大期望,百度研究院發佈2022年十大科技趨勢預測就曾指出,2022年,AIGC藉助大模型的跨模態綜合技術能力,將提升內容多樣性,降低製作成本,將實現大規模應用。
百度有優勢,過去半年裏在AI虛擬人領域的頻頻佈局,無不彰顯着要在下一代互聯網到來之時搶先佔位的野心。