S&P Global最新研報:AI、元宇宙和人機交互的未來_風聞
元力社-11-08 18:15
本文主要觀點:
元宇宙是實時在線工作、娛樂互動形式的演變願景。生成式人工智能為元宇宙提供了創建豐富且身臨其境3D內容的途徑。沒有任何一家公司或平台能夠獨立提供元宇宙,因為元宇宙將涵蓋所有具有商業和社會影響的企業應用。目前的技術尚未完全發揮元宇宙的潛力——在改善人類互聯性和模擬物理世界方面,但隨着相關技術和算力的進步,元宇宙的願景將會實現。
01.
VR/AR並非元宇宙必要條件
S&PGlobal將元宇宙定義為互聯網下一個階段的長期願景,它將以單一、共享、沉浸式和持久的3D虛擬空間為特徵,在這個空間裏,人類、機器和數據可以相互交互,它既能增強物理世界,又能取代物理世界。
雖然許多人已經瞭解虛擬空間、虛擬化身等基本知識,但元宇宙概念所涵蓋的願景卻要廣泛得多。例如,元宇宙通過開發數字孿生能夠影響工業應用,在數字孿生中,整個工廠和流程可以在實體建設之前以數字形式構建,從而節省時間、金錢和資源。數字孿生的工業部署包括在精確的虛擬仿真環境中使用數字孿生,以便在設施投入使用前對員工和自主機器人進行培訓。
元宇宙應用還能支持企業的協作交流。利用元宇宙技術,員工可以擺脱視頻形式的束縛,利用虛擬空間和虛擬化身與同事進行動態交流和工作配合。在消費領域,品牌、藝人甚至高校都在使用元宇宙來提升虛擬產品、表演活動以及在線課程的互動性。這些應用和體驗並不是由單一應用程序來完成的,隨着平台間互操作性的標準和要求的完善,單一元宇宙的願景終將會實現。
人們對元宇宙的一個常見誤解是,參與元宇宙需要一直佩戴VR或AR頭顯。事實上,用户可以根據自己的需求和所在環境,以多種方式訪問應用程序,就像我們今天有多種方式參與互聯網活動一樣。
通過頭戴式設備完全沉浸在虛擬世界的應用程序中,可能是完全沉浸(VR)或將數字信息添加到物理世界(AR)的最佳體驗,而在除此之外的其他時候,人們首選的工具可能仍然是智能手機。
02.
捲土重來的元宇宙
這並不是元宇宙第一次受到企業廣泛關注。上一次浪潮發生在2006年至2009年,當時智能手機還沒有普及,社交媒體也還沒有大規模出現。在那次浪潮中,人們探索了許多應用,發現它們有用且有趣,但當時技術水平和用户需求均不夠充分。
現在,市面上有了更多聯網設備、更廣泛的Wi-Fi接入、5G蜂窩網絡以及雲和流媒體服務。人們經常在網上購物、社交和遊戲,甚至在疫情的催化下出現了混合工作模式。所有這些因素都引發了我們該如何更好地進行在線互動的問題,無論是與數字內容互動還是人與人之間的互動。
元宇宙還可以減少社會對環境的有害影響。簡單來説,未來元宇宙實現朋友、家人和同事間“數字會面”後,可能會影響到環球航空旅行等業務,而航空旅行在人類引起的全球變暖中佔比4%。
03.
無縫體驗和數字鴻溝
目前,元宇宙要實現充分模擬人際交往的溝通方式還有一定的距離,但只要兩個主要問題得到改善,通過技術和社會經濟的共同進步是可以實現這一點的。首先,技術需要提供流暢、無縫的體驗,以實現人類交流的微妙之處。其次,我們需要縮小“數字鴻溝”,因為互聯網仍在很大程度上是發達國家的專利。
關於第一點,我們在應對COVID-19期間的經驗是,要使工作人員能夠有效地遠程履行職責,需要責任心、細心和勤勉。從眼神交流等物理範式,到需要更高帶寬來支持視頻和音頻質量,從而能夠傳輸微妙的肢體語言和語氣,這些都是需要解決的技術難題。
不過,我們已經看到了眼球追蹤技術、用於降噪的音頻技術和用於保護隱私的虛擬背景等技術的興起,這些技術有助於緩解其中的一些問題。機器學習和人工智能技術很可能會提供模式識別能力,從而實現物質進步,進一步縮小差距。
關於第二點,必須認識到並解決數字鴻溝問題,發達國家的互聯網連接水平明顯高於發展中國家,因此從互聯網技術中獲益的潛力也不平衡。
根據布魯金斯學會的數據,歐洲的互聯網普及率為89%,美洲超過80%,阿拉伯國家為70%,而亞洲為61%,非洲為40%。如果考慮到性別、年齡、農村人口與城市人口等因素,這些差距還會更大。
而只要有數字基礎設施和技術的支持,元宇宙將為縮小地域差距,實現朋友、家人、同事、師生以及其他各種關係的數字溝通提供解決方案。此外,生成式人工智能的進步還能更好地拓展我們所生活的物理世界之外的想象世界,既支持人類的創造力,又能更好地包容各行各業的人。
此外,元宇宙相關技術,以及機器學習和人工智能等技術的進步,必然會促進量子計算等計算技術的進步。令人興奮的是,量子計算所帶來的計算優勢可用於更有效地分析物理世界,從而實現對物理過程的虛擬實驗。
核能就是一個很有前景的例子。由於安全問題和成本考慮,核能發電的許多實驗都停滯不前,但以數字形式有效模擬這些實驗確實可以減輕其中的一些阻礙,從而推動物理核能的發展。這種進步可以極大地改善目前的能源和氣候危機狀況。
04.
什麼是生成式人工智能?
對於人工智能的某些領域來説,2022年和2023年是非常重要的一年。雖然到目前為止,大部分人工智能和機器學習(例如工業預測維護或醫學成像領域的人工智能和機器學習)一直沒有引起公眾的廣泛關注,但普通網民卻突然能夠通過OpenAI的ChatGPT和谷歌的Bard等界面與大型語言模型(LLM)互動,提出問題並接收各種文本內容的回覆。
這一發展伴隨着圖像生成人工智能的興起,其中以《DALL-E》和《Midjourney》為代表。人工智能驅動的圖像生成技術可以根據文本提示或其他圖像創建各種風格的圖像。一些搜索引擎已經開始採用這種技術。
例如,如果用户找不到他們要找的圖片,搜索引擎就可以利用人工智能生成功能創建類似的圖片。這種文本生成、圖像生成甚至代碼生成的能力正在各行各業引起轟動。與元宇宙一樣,生成式人工智能也有可能影響我們與數字內容以及人與人之間的每一次互動。