如何打造視頻雲的新範式,火山引擎交出了答卷_風聞
Tech星球-Tech星球官方账号-聚焦互联网前沿科技和新商业。08-23 17:32
來源 | Tech星球
文 | 任雪芸
當視頻作為信息傳遞模式出現,文字、數據、聲音在視頻相襯之下顯得相對冗長和單調。於是,谷歌在2015年就給出了這樣的預測:“未來互聯網世界80%的內容將是以視頻形式呈現的。”
隨之抖音、快手為代表的新一代現象級應用的誕生,使得短視頻賽道全面爆發。
不同於有組織的數據,以視頻和圖片為主的非結構化數據快速增長,為企業的帶寬和性能帶來巨大壓力。隨着越來越多的企業關注視頻,各類廠商對視頻雲的需求與日俱增,視頻雲隨之擴張。
據艾瑞諮詢提供的數據報告顯示,從2022年到2027年中國音視頻雲服務的市場規模複核增長率將達到24.4%。內容視頻化的趨勢帶動了視頻雲行業的增長,但市場規模持續擴大的背後,關乎於用户體驗的視頻質量,需要視頻雲廠商為此不斷提供底層算力支持與視頻技術的優化。
早在今年4月份,春季火山引擎 FORCE 原動力大會上,火山引擎總裁譚待就指出,更高清、更互動、更沉浸是消費者視頻體驗提升的三個關鍵方向。
為此,面對這一市場趨勢,火山引擎持續基於技術能力的提升和解決方案的迭代,為企業視頻化服務提供新的增長動力。8月22日,火山引擎舉辦視頻雲&AIGC技術大會,基於軟硬件技術的一體化創新推動了視頻雲行業的新變革。
更清晰、更暢快的視頻體驗
視頻體驗的每一次優化,其本質都是背後技術的突破與演進。
伴隨着視頻規模的持續增長,用户對視頻清晰度體驗的追求持續提升,而網絡和終端硬件設備也在不斷進行迭代。不能否認的是,在視頻數字化趨勢之後,超高清化的視頻讓各大廠商面臨着持續且重大的技術革新。
從移動互聯網終端觀看分辨率去看,早先的360P、480P幾乎被用户拋棄,當下用户的選擇逐步從720P、1080P走向4K、8K這類超高清視頻。不侷限於清晰度本身,當下沉浸式的視頻體驗同時也會追求更高幀率,和更寬的色域。
在“更清晰”、“更暢快”的需求背後,表面上是分辨率和幀率的提升,以及色域的增強。但從視頻雲所肩負的責任出發,其面臨的則是視頻信息量的成倍增加。用户所需要的極致視頻體驗和帶寬、計算成本、編碼速度之間的衝突在不斷加深。
與此同時,當下以AIGC為代表的AI能力、Apple Vision為代表的MR/XR等技術正迅速崛起,隨着這些技術的飛速發展,物理世界與虛擬世界的壁壘不斷被打破。
基於技術方案的升級,如何實現各場景中終端用户對沉浸式、智能化視頻的需求成為了擺在眼下的難題。
作為字節跳動旗下的雲服務平台,火山引擎在產業端深度覆蓋了抖音等字節系App,通過長期服務抖音、西瓜視頻、飛書等產品,沉澱積累了包括視頻點播、直播、實時音視頻、雲遊戲和雲渲染等產品在內的大量經驗和解決方案,可提供視頻的全鏈路技術服務。
而內部業務的高速循環推動了火山引擎的持續增長和創新需求的爆發。於是,從2022年起,火山引擎就推出了以云為底座的一系列產品解決方案,包括企業上雲和智能營銷通用方案。
此次,火山引擎視頻雲技術能力繼續升級,基於軟硬件的迭代和AIGC技術的成熟,對於各場景視頻雲的應用給出了新的解法:既要實現軟硬協同,又要深度自研。
打造軟硬協同的一體化能力
在這次大會上,火山引擎發佈了一款自研視頻編解碼芯片。相對於行業主流硬件編碼器,這款芯片能夠帶來30%左右的效率提升。
在具體的業務場景應用上,這款芯片所具備的超高算力密度能對大量,甚至全量的點播或直播的視頻提供高質量的轉碼,從而降低業務帶寬成本並提升用户體驗和業務指標。
此外,這款芯片為不同視頻場景提供不同的算力支持,火山引擎實現了通用算力到異構算力的跨越,除了ASIC算力的自研芯片外,火山引擎FPGA硬件編解碼器曾獲得多項國際賽事獎項。據Tech星球瞭解,自研的高密度ARM陣列服務器能夠為用户提供極具性價比的算力,相比x86資源,可以節省40%以上的成本。
構建在異構算力之上,在視頻中,基於提升用户體驗和降低成本的角度出發,其往往需要經歷轉碼、編輯、分析,圖片處理等各類視頻處理方式,在這些能力背後,一個視頻底層的處理系統支撐着上層業務的流轉。
以BMF框架為例,作為一個動態多媒體處理框架,其目標是把所有多媒體處理的原子能力進行插件化管理,然後提高系統的可擴展性以及開發和運維的效率。
隨着字節自身短視頻和圖片業務的井噴式增長,BMF最終跳脱於傳統框架,實現了對視頻生產、下發、到播放等全鏈路視頻週期的覆蓋。在此次產品升級中,火山引擎方面表示,BMF框架的功能多樣性、易用性、兼容性、穩定性和性能得到了充分的打磨,因此,正式對外實現開源。
當下自研芯片、ARM陣列服務器和BMF框架開源已經成為了火山引擎視頻雲的基礎底座。隨着這些技術能力的進一步釋放,以及智能汽車、金融、醫療、社交等新場景的不斷豐富,視頻雲技術得到了持續的擴展。
此外,綜合考慮到客户各類需求,當下視頻雲廠商們越來越傾向於提供整合能力 ,基於客户使用的實際場景靈活切換使用。
以自動駕駛場景為例,毫末智行與火山引擎攜手打造了遠程駕艙及運營平台產品,支持監督、脱困豐富介入模式,鍵鼠、手柄、駕駛模擬器多種部署方式,而且實現了低卡頓、低時延、低帶寬佔用。
這款產品目前已經應用到毫末智行全棧自研的末端物流自動配送車小魔駝之上,能夠在遠程車控場景中實現車機視頻採集和遠端操作員的同步,以此保證駕駛操作安全、可靠、穩定。
根據數據顯示,基於毫末智行與火山引擎打造的這款產品,在駕倉的應用中,視頻的卡頓率能夠降低到0.3%,視頻端到端的時延能夠達到100ms,同等清晰度的情況下,帶寬的佔用減少30%左右。
目前,火山引擎視頻雲在雲遊戲、金融直播審核、互動營銷、智慧汽車、互娛等領域已經成為了基礎設施,在各類場景的使用中,它一直在為“更高清”、“更交互”、“更沉浸”的視頻體驗做出努力。
探索AIGC和視頻雲的邊界
對於視頻雲行業的玩家們而言,在提供給用户超高清和超低時延、強融合的視頻平台背後,雲廠商們需要具備底層強大的算力支持,還需要利用以AIGC為代表的技術推動內容生成。
自ChatGPT發佈以來,AIGC如同打開了創新之門,各種類型的AI創新產品持續出現,隨着AIGC的技術迭代,AI能力應用於視頻愈加普遍。
以視覺大模型應用於影視修復為例,這是火山引擎在近日聯合抖音做的項目——對100部香港經典老電影進行4K修復。
眾所周知,老電影的修復工藝往往是複雜且瑣碎的,要歷經物理修復、數字修復、藝術修復等步驟。一位經驗豐富的修復師需要長達1個月的時間才能夠修復完成一部影片。
但隨着深度學習AI技術的發展,老片修復的質量和效率正在進一步提升。
2021年7月,火山引擎曾首次面向企業推出了“智能處理”工具包,將經過抖音打磨和驗證的同款技術對外輸出。目前,火山引擎視頻雲已經形成了更為完整的智能處理系統,以老片修復為代表場景的畫質增強技術是其中一項子功能。
與此同時,據Tech星球瞭解,控制模型的邊界條件、強化高質量生成空間等手段,火山引擎視頻雲提升了大模型的圖像輸出質量。通過採用設計時域的自編碼器、光流特徵對齊、時域條件約束等技術手段,讓大模型在修復的過程中能夠完整使用前後幀的信息,更好地處理視頻任務。
當下,這樣的技術也被應用在虛擬演播室之中。在火山引擎視頻雲與雲創智媒的合作中,為央視提供技術支持,破除環境侷限、降低硬件成本和專業門檻是核心目標。
在這樣的目標背後,火山引擎視頻雲基於中台算力部署,進行雲渲染製作,能夠實現可視化交互流程和無綠幕摳像的能力。此外,通過整合火山引擎視頻雲AI能力,其搭建媒體生產AI處理平台。據云創介紹,基於雲渲染的分佈式部署架構,能夠實現AI能力的按需調用。
不僅在傳媒領域,千行百業視頻內容的爆發,對創作工具提出了更高要求,為了幫助企業高效生產內容,火山引擎視頻雲團隊與智能創作雲團隊正在為企業提供智能、快速、批量的視頻創作工具,涵蓋從創意策劃、內容製作、內容管理、內容發佈、數據反饋的創作全流程。
通過智能創作,抖音店鋪通過精彩的短視頻或是生動的直播實現拉新,金融行業數字人直播通過內容促活,激發業務增長,自如通過VR看房提升效率的同時,也大大增加了轉化率。
火山引擎融合AIGC,正在實現腳本的撰寫、改寫和擴寫,並通過文生圖的能力製作海報,這些AI工具大大地解放了生產力,讓企業有了更大膽的創新空間。
不侷限於內容生產,AI同樣在改變虛擬數字人的誕生。
針對虛擬數字人,火山引擎推動了形象自然寫實、海量音庫、交互技術閉環的升級。分別對應於虛擬數字人聲音復刻、任意模態合成音效、超擬人效果等。
其中,形象自然寫實技術支持2D真人、3D卡通、3D超寫實全類型形象定製,同時支持低成本真人1:1形象復刻。
音庫則能夠適配汽車、金融、新聞播報、政府等多個核心領域,支持10餘種語種和方言。
據火山引擎具體介紹,聲音復刻的自然度高達4.6分,能夠充分利用低質量海量音頻數據,對其中的口音、風格、情感進行解耦並建模,從而存儲大量音頻屬性,實現應用中的自由遷移。
在合成音效上,用户可以輸入任意文字來合成想要的音效,並結合開源數據進行訓練。在超擬人效果上,通過利用低質量海量視頻數據建立起的通用數字人基礎大模型,能夠生成表情、動作、聲音更協同的數字人。
2022年,火山引擎曾推出了以云為底座的一系列產品解決方案,這個脱胎於字節跳動快速發展過程中的雲服務平台,持續將積累的增長方法、技術能力和應用工具開放給外部企業。
而此次,隨着軟硬件的升級和場景的持續落地,在與AIGC結合的大趨勢下,火山引擎視頻雲所打造的“智能視頻”正在改變原本的交互方式,從業務應用的角度上持續提升視頻內容成產效率。
儘管當下視頻雲還處在技術競爭時代,能力模型的同質化明顯,但當產品進入行業落地和場景應用時,基於AIGC能力的深化,打造軟硬協同的一體化能力將成為下半場行業競爭的關鍵。#火山引擎發佈自研視頻芯片#