視頻云為什麼能成為阿里、騰訊、字節跳動“拆牆”的首選?_風聞
智能相对论-智能和车,边评边测;未来和家,且品且鉴2022-03-28 13:48

文丨智能相對論
作者丨陳選濱
前不久,字節跳動旗下火山引擎組了一個局——視頻雲科技原力峯會,並拉上了阿里雲、騰訊雲國內兩大雲廠商,聯合發佈了一項“超低延時直播協議信令標準”。

基於這個新標準,阿里雲、騰訊雲以及火山引擎共同為視頻直播行業首次定義了直播“客户端-服務器”信令交互流程,使得傳統直播技術3至6秒的延時縮短到了1秒以內,最快可達到500毫秒。且不同技術供應商在一套標準方案下更加方便互通,行業參與者使用一套SDK(軟件開發工具包)即可無縫切換各種供應商的產品。
儘管這並非一次業務合作,而是技術共建。但,從某種程度來看,在視頻雲技術領域,阿里、騰訊、字節跳動已經有意加速互聯網的“拆牆行動”,由新BAT格局引領、聚焦到視頻雲,更是成為接下來互聯網發展的重磅焦點。
更低的延時、更協同的技術標準……從這一次標準發佈來看,視頻雲背後的技術動向已經預示了一個泛視頻時代的來臨,不惜讓阿里、騰訊以及字節跳動三大巨頭放下了“對立意識”,走向全新的競合關係。
01 越底層,越標準
“廣泛的商業場景內容正在從圖文走向視頻。”在此次"超低延時直播協議信令標準"發佈上,火山引擎總經理譚待提出判斷。
而這一判斷在大數據的佐證下也更加清晰。根據QuestMobile發佈的《2021中國移動互聯網年度大報告》顯示,互聯網場景中的視頻內容增長勢頭迅猛,以短視頻為代表,全網用户11.74億,時長佔比25.7%,已經成為了佔據人們網絡時間最長的行業。

跳出了短視頻,還有中長視頻、直播等一系列基於視頻化的內容輸出與交互模式,都已經成為當前互聯網服務的主流形態。
艾瑞研究院副總經理徐樊磊在去年的Imagine阿里雲視頻雲全景創新峯會上提到一個觀點:視頻不應該被看作一個單獨的行業,就像雲計算同樣不該被看作一個單獨的行業,它們都將滲透到各個行業、各個場景。
可以預見,隨着視頻化應用的滲透與擴展,未來將是一個泛視頻時代。而越是底層的支持,對於標準化的需求也就越高——當一項技術發展成為一個通用形態,用的人多,做的人也多,流程之間的標準化也就愈發關鍵。
眾所周知,當前視頻行業採用WebRTC技術是谷歌在2011年開源的一個API,但並沒有一套標準化的信令交互流程。這也就導致了不同廠商之間都有着自家的一套客户端與服務器的交互邏輯,存在着流程上的差異。
比如,此前的信令流程就特別繁雜,標準WebRTC的信令往往需要經過SDP交換,ICE交互,DTLS握手之後才能傳輸流媒體數據,這導致了直播首幀耗時嚴重惡化,非常不流暢。
對於這個問題,各家都在提出自己的優化方案,比如騰訊雲就是通過miniSDP和0-RTT的結合來大幅減少信令耗時,提升信令交互成功率。但,這種優化方案如果不能在行業內形成統一的標準,那麼各家的解決方式不一樣,所帶來的優化體驗還是非常有限的。
因此,隨着視頻化應用的滲透率越來越高,對於底層技術標準化的共識也就越強烈。但,最終這種標準化能實現到什麼程度,還得看未來市場的發展。當前,不管是阿里、騰訊還是字節跳動,之所以在這個節點上發佈新標準,除了在技術共建方面初步達成共識之外,最多的考慮主要還是對自家技術能力和行業影響力的展示,也就是“秀肌肉”。
簡而言之,三大巨頭的“共識”不僅僅只是技術標準化,更有相互“搭台”突顯自家技術優勢之意。
02 拼技術的週期到了?
徐樊磊認為,雲服務市場的需求週期在於前期主要看成本,後期則看能力。
那麼,從三大巨頭的技術共建來看,視頻雲作為雲服務的一個焦點領域,儼然已經進入到了看能力的後期階段。
技術以及技術帶來的突破價值也是當前各大雲廠商講得最多的一個話題。
技術的標準化是一方面。就在火山引擎召開視頻雲科技原力峯會的前三天,騰訊雲便聯合了中國信通院發佈《超低延時直播白皮書》,“搶先”為超低延時直播技術標準化奠定基礎,從技術層面拿下行業創新的話語權。
但,在拼技術的賽道上,“先人一步”還不足以説明什麼,最關鍵的還得“勝人一籌”。簡單來説,技術所帶來的成果展現最為重要,也是這一週期內市場最想看到的雲廠商差距與優勢。
當前視頻雲技術所要為行業帶來的變革主要聚焦在兩方面:
一是“數量”問題,即解決視頻應用的規模化落地問題,比如如何降低視頻創作的門檻,保證視頻內容的大規模產出,拉動全民視頻消費等等。
從這個角度來看,快手、抖音等短視頻平台同步推出的雲端剪輯工具,如雲剪、剪映等就屬於一個基礎的視頻雲解決方案之一。
再深入一點,又比如冬奧會期間,央視體育新媒體和總枱技術團隊聯合阿里雲視頻雲、阿里巴巴達摩院打造的智能生產工具“AI雲智剪”,依託AI技術的引入,能在比賽完成的第一時間實現對比賽視頻內容的多維度解析,生成精彩素材,並創作出相應的主題視頻,為人們帶來及時的視頻化內容。

二是“質量”問題,即通過技術突破開拓視頻應用邊界,帶來更多元化的視頻化體驗,比如如何創新視頻的交互模式等等。
阿里雲視頻雲在冬奧會上基於AliRTC(音視頻通信技術)推出的雲上創新解決方案——阿里雲聚“Alibaba Cloud ME”,就是視頻交互模式的一次應用試探。

呈現出來的全息形態之所以如此真實並能保證實時動態交互,就在於阿里雲視頻雲視頻編碼與增強技術團隊提出了一種結合可變形卷積的稠密殘差連接網絡結構,極大提升了窄帶高清產品對視頻的轉碼效果。
不可置否,在今年的冬奧會上,阿里雲視頻雲着實是用技術秀了一把“肌肉”。
對於整個視頻雲領域而言,這也是不可避免的趨勢——拼技術,還要拼出創新度、拼出亮眼的效果,就如同視頻本身所帶給人們的視覺衝擊感一樣,都是接下來雲服務廠商角力的關鍵。
03 產業的格局已經鬆動
站在今天的視角來看,「視頻化」的想象力是無限的。這種想象能實現多少,本身也就取決於廠商的技術能力。
但,可以確定的是,伴隨着技術的持續迭代,視頻化的一步步升級,產業的格局也在一點一點的鬆動,發生變革。
這種鬆動信號,在百度智能雲的“智能視頻雲3.0全景圖”中也能有所預見。
根據介紹,百度智能雲基於元學習-遷移學習的視頻生成技術可根據需求快速定製不同風格的高質量視頻,並同時結合虛擬數字人形象生成與語音合成、唇動等技術,低成本製作形象豐富靈動、線上線下多端覆蓋的的數字人,由此應用到媒體主持、金融客服、文娛偶像等場景中。
同樣是在今年冬奧會上,“百度智能雲曦靈”團隊打造的AI手語主播就是一個已經落地的應用。

這種「視頻化」的多元應用就已經不僅僅是對一塊屏幕表現力的改革,而是對整個產業的基礎邏輯的變革——生產力的轉變。
從這個角度來看,我們可以發現,負責內容生產、導播、交互的主體已經開始向AI中台以及虛擬數字人轉移,視頻雲技術的應用使得“它們”具備了更強的表現力和規模化落地的條件。
在本屆冬奧會上,阿里雲的“AI雲智剪”就已經自動化處理了200+場比賽,生產素材片段達3萬段以上。而像百度AI手語主播這樣活躍在冬奧會各個場景的虛擬數字人也多達將近30個,其中就包括了騰訊的“聆語”、科大訊飛的“愛加”、小冰公司的“夏語冰”等等。
在這些虛擬數字人的背後,正是視頻雲技術的創新與應用。
不要低估了視頻雲。
在《視頻雲發展趨勢洞察》報告中,IDC認為,數字化時代,從商業活動到社會生活,視頻數據已經成為連接個人、家庭、社區乃至社會的重要紐帶。IDC預測,到2025年中國視頻雲市場規模更將達到314億美元。
不管是從市場潛力還是應用前景來看,視頻雲都充滿巨大的想象空間。
也不枉阿里雲、騰訊雲、火山引擎、百度智能雲等各大雲廠商紛紛下場,走向競合!
*本文圖片均來源於網絡
深挖智能這口井,同好添加vx:zenghy2017
此內容為【智能相對論】原創,
僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、複製或建立鏡像。
部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯繫。
智能相對論(微信ID:aixdlun):
•AI產業新媒體;
•今日頭條青雲計劃獲獎者TOP10;
•澎湃新聞科技榜單月度top5;
•文章長期“霸佔”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個為什麼》
•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、雲計算、開發者以及背後的芯片、算法等。