YouTube成立20週年之際探討視頻中人工智能的未來 - 彭博社
Mark Bergen
插圖:Adam Ferriss為彭博社創作
彭博社記者Mark Bergen在其著作 《點贊、評論、訂閲》 (維京出版社,2022年)中記錄了YouTube成為現代傳媒沉睡巨頭的動盪歷程。此後,人工智能的蓬勃發展為這家視頻巨頭帶來了其20年發展歷程中最大的挑戰與機遇之一。在《下一章》欄目中,Bergen展望了AI時代YouTube的未來圖景。
YouTube副總裁Amjad Hanif近期會見了埃及網紅Farah Medhat,後者在海外擁有大量粉絲。Medhat在YouTube上的第二大受眾羣體位於韓國,當地粉絲通過字幕觀看她的阿拉伯語視頻。Hanif相信公司的人工智能技術很快能讓Medhat在屏幕上説一口流利的韓語,助她觸達更多觀眾。
他預計五年內,上傳至YouTube的每個視頻都能自動譯製成所有口語版本。每個單詞都將保留説話者的真實音色,嘴唇動作也會像母語者般自然重塑。這只是YouTube計劃為創作者眾多能力中的一項,據公司表述,旨在幫他們擴大受眾羣體。“您只需創作一次,我們負責讓全世界都能輕鬆觀看,“負責創作者產品的Hanif表示。他希望每位上傳者都能使用YouTube母公司Alphabet Inc.旗下谷歌的AI工具來構思創意、生成素材、剪輯視頻、進行營銷,最重要的是——提供視頻表現的細粒度數據,激勵他們發佈更多內容。
二十年前,YouTube首個視頻上線——那是聯合創始人賈韋德·卡里姆發佈的一段19秒的搞笑內容。這個視頻分享網站從最初與好萊塢和廣播電視對抗、雜亂無章且虧損的運營狀態,逐漸發展成為如今傲視羣雄的全球巨頭。在此過程中,它與數百萬內容創作者建立了深厚聯繫,其中許多是專業創作者,他們依靠這個平台謀生或為之奮鬥。
這種關係並不輕鬆:YouTube歷來在制定政策、版權規則和商業策略時,即使是最知名的創作者也鮮有發言權。然而,YouTube現在表示,人工智能(AI)將讓它的創作者大軍在媒體世界中佔據更大份額。這很公平,因為谷歌在開發自己的AI模型Gemini時,利用了無數小時的YouTube內容,而許多創作者並不知情。(YouTube發言人表示,公司使用視頻內容“是為了改善YouTube和谷歌上創作者和觀眾的產品體驗,包括通過機器學習和AI應用”,並且“符合創作者同意的條款”。)
成功故事
YouTube的規模比以往任何時候都大。儘管面臨來自Spotify、TikTok和電視流媒體的日益激烈的競爭,但去年其廣告銷售額達到了361億美元。研究公司MoffettNathanson估計,其訂閲和其他收入來源還貢獻了180億美元,該公司預測,明年YouTube將超越華特迪士尼公司,成為美國收入最高的娛樂企業。“這是一個驚人的成功故事,”廣告巨頭WPP Plc的首席執行官馬克·裏德説道。
高管變動並未減緩平台的發展步伐。2023年初,蘇珊·沃西基辭去首席執行官職務後,尼爾·莫漢接管了YouTube。(沃西基次年因肺癌去世)。作為2015年加入YouTube的谷歌廣告業務資深人士,莫漢在延續沃西基對本土創作者公開重視的同時,推動YouTube進一步深入主流媒體渠道。他大力進軍播客領域,接納了YouTube形形色色的右翼視頻博主;在2月的CEO公開信中,莫漢特別提到了喬·羅根對唐納德·特朗普的競選專訪。今年早些時候,YouTube宣佈其平台每月有10億人收聽播客,鞏固了在該類別對Spotify的領先地位。
莫漢將擴大電視屏幕收視率作為另一重點,藉助近期與NFL的合作,甚至吸引競爭對手的流媒體服務入駐YouTube應用。他還支持了艾美獎對超級YouTuber如Rhett and Link的提名。Rhett and Link所屬Mythical Entertainment總裁布萊恩·弗拉納根表示,YouTube與其"在收視率、變現、獎項、文化影響力等各方面被視同電視的雄心不謀而合”。
人工智能時代
2022年9月,我出版了著作《點贊、評論、訂閲》。兩個月後,ChatGPT橫空出世,掀起的生成式AI浪潮對媒體行業的衝擊力,堪稱YouTube問世以來之最。新興AI工具正讓人們以空前速度和低成本生產內容,互聯網充斥着以假亂真的模仿作品、深度偽造和明目張膽的剽竊。好萊塢並未熱情擁抱生成式AI——像病毒式傳播的偽造Drake單曲這類早期案例,其詭異能力被視為未來盜版氾濫的預兆。
面對搜索引擎業務遭遇的前所未有挑戰,谷歌也完成了自我重塑。但在視頻領域,這家公司擁有應對AI內容時代的充足籌碼。谷歌推出的VeoAI視頻工具,僅需在聊天框輸入指令即可生成影像。儘管OpenAI等公司已推出類似產品,但YouTube龐大的分發網絡意味着:即便創作者使用競品AI工具,谷歌仍是贏家——想要視頻被看見的人,終會將內容上傳至YouTube。
隨着AI生成內容的新浪潮湧現,YouTube與其他網絡平台一樣,在保持內容流量的同時努力應對版權問題。在這方面YouTube具有優勢:近二十年來,其運行的Content ID系統——這套龐大的軟件能檢測視頻中的版權素材,基本安撫了好萊塢和音樂產業。生成式AI興起後,YouTube迅速採取行動,與環球音樂集團和創新藝人經紀公司簽署協議,監控平台上未經授權的音樂人、運動員及演員AI替身。YouTube近期還將多位頂級網紅納入深度偽造防護計劃。創新藝人經紀公司戰略發展主管亞歷山德拉·香農表示,各科技平台處理深度偽造的持續性參差不齊:“必須承認,YouTube正引領着這一領域。”
但YouTube在解決生成式AI另一關鍵爭議——該行業通過未經許可抓取海量網絡數據得以發展——時卻顯得不夠果斷。如今的聊天機器人能撰寫像樣的郵件和詩歌,前提是它們經過訓練(通常通過採集大量網絡文本輸入語言模型的軟件程序)。以網絡爬蟲搜索起家的谷歌,對這一做法再熟悉不過。
ChatGPT問世後不久,眾多公司競相開發能生成圖像、語音和視頻的人工智能。YouTube成為了訓練數據的金礦。自2017年起,每分鐘至少有400小時的視頻被上傳,構建了一個無與倫比的檔案庫。《連線》與《Proof News》 報道稱,去年多家硅谷巨頭使用了包含數千個不知情YouTube頻道內容的訓練數據庫(報道中提及的公司之一Salesforce Inc.發言人表示該數據庫"公開可用且遵循寬鬆許可協議”)。該領域的版權問題仍處於灰色地帶,對許多YouTuber而言,企業似乎將YouTube視為免費開放的資源庫。
這種模糊性在去年OpenAI發佈AI視頻生成模型Sora時公開化。時任OpenAI技術總監的Mira Murati在《華爾街日報》採訪中被問及公司是否抓取YouTube訓練Sora時面露難色:“我確實不確定”。
一個月後,Mohan接受彭博社Emily Chang採訪時表示雖不瞭解OpenAI的具體操作,但強調YouTube禁止未經許可盜用視頻:“這是基本規則”。當被問及谷歌自身AI模型Gemini是否遵守此規則時,Mohan迴避了直接回答,僅表示公司使用YouTube內容"符合平台服務條款"。
這是個含糊其辭的回答。紐約時報去年報道稱,OpenAI故意使用YouTube數據訓練模型,部分谷歌員工知情卻因公司同樣行為而保持沉默。(YouTube發言人重申了莫漢關於未經授權抓取的聲明。OpenAI向《紐約時報》表示其依賴"多種數據來源";這家初創公司發言人拒絕進一步置評。)
即便是頂級YouTuber和商業夥伴也難以弄清數據抓取詳情及YouTube的知情程度。“掩蓋此事符合他們的利益,“資深經紀人、Night經紀公司總裁埃茲拉·庫珀斯坦表示,“未來回顧時,這將被視為對所有內容的剝削。”
去年八月,資深YouTuber漢克·格林(深受平台青睞)就莫漢對張的回應發佈長視頻。根據YouTube服務條款,上傳視頻即授權平台使用內容"運營、推廣和改進"服務——格林指出該條款現在已包含訓練谷歌AI模型。他二十年前開始發佈視頻時,大語言模型根本不存在。“我當時根本不知道同意了這個,“視頻中憤怒的格林説道。
多年來,YouTube一直採用雙軌制運營模式。對於由唱片公司和傳統媒體機構運營的頻道(如泰勒·斯威夫特和吉米·法倫等名人),平台採用一套支付與合約管理方式;而對於構成平台主體的"獨立"創作者(如格林),則適用另一套規則。當谷歌開始研發生成式AI模型時,決定不使用YouTube媒體合作伙伴的內容進行訓練,但確實依據服務條款許可,使用了創作者的材料。
但公司從未明確説明這一點,也未透露OpenAI等機構的抓取程度。“以我的立場來看,這明顯是在剝削我,“格林在視頻中表示。
YouTube拒絕讓莫漢接受採訪。部分YouTube員工私下辯稱,谷歌比OpenAI等機構更負責任,因為它並未抓取全部YouTube內容。去年12月,YouTube推出新功能,允許創作者向第三方表明開放數據抓取。(該公司尚未公佈相關數據收集計劃,但發言人表示該功能不會改變服務條款。)
一批新興企業正試圖利用這類數據交易,在谷歌體系外建立市場,讓創作者可以向AI開發者出售閒置視頻素材。前YouTube員工、現Vermillio公司首席戰略官凱瑟琳·格蕾絲指出,這種模式旨在向內容生產者傾斜,為其開闢YouTube之外的收入渠道。她將這種模式與YouTube長期運行的版權系統對比:“這對所有人都公平嗎?誰獲得了萬億美元市值?是谷歌。”
YouTube高管哈尼夫證實,平台的數據訓練選擇加入條款不適用於谷歌自身模型。他向創作者解釋,接受服務條款的交換條件——即同意上傳至YouTube的內容可能用於訓練Gemini模型——意味着能使用公司最新功能,如自動視頻翻譯、評論智能回覆和觀眾數據分析AI工具。“我的解釋是,他們期待的許多功能都依賴於Gemini。“哈尼夫表示。
創意民主化
YouTube正與數十萬創作者測試AI配音技術,可將英語視頻即時轉換為八種其他語言(或反向轉換)。公司數據顯示,這些視頻超40%的觀看量來自配音語言觀眾。負責該功能的副總裁克里斯蒂安·厄斯特林稱,2025年YouTube有"非常雄心勃勃的擴展計劃”。目前正運行小規模試點,專注於配音聲音克隆技術,並試驗唇形同步重塑技術。未來該技術或應用於歷史影像甚至已故名人視頻片段。“這些都在考慮範圍內。“厄斯特林表示。
如MrBeast等頂級YouTuber已自費採用外部配音技術或聘請多語種配音演員。YouTube計劃免費提供這種"巴別塔"能力。人才經紀公司WME戰略主管克里斯·傑奎明用YouTube的標誌性詞彙形容,這類生成式AI功能將"實現創意民主化”。
許多創作者願意採用這類工具,如果它們能節省時間或金錢。但有些人並不情願完全擁抱AI。薩姆·貝雷斯(Sam Beres)是一位在其頻道上嘗試AI產品的創作者,他擔心配音會拖累收入,因為一些廣告商更看重英語國家的高觀看率。(YouTube發言人表示,將英語配音成其他語言的創作者可能會看到平均廣告價格“略有下降,而將其他語言配音成英語的創作者則相反”,並補充説“在這兩種情況下,觸及新觀眾都會增加他們的觀看量,因此在大多數情況下,他們的收入應該會增加。”)
一些YouTube頻道擁有鐵桿粉絲,他們認為AI是出賣或剝削創意工作者的標誌。“如果一個元素是由AI生成的,他們會立即攻擊你,”Mythical Entertainment的首席創意官史蒂維·温·萊文(Stevie Wynne Levine)説。“而且他們這樣做是對的。”
其他人則沒有那麼有原則。YouTube已經看到了大量AI生成的內容。只需在網站上搜索電影預告片;很明顯,分辨什麼是真實的變得越來越困難。
“我們已經有了數十萬,甚至數百萬的無面孔AI頻道,”歌手兼YouTuber彼得·霍倫斯(Peter Hollens)説,他預測AI頻道的數量只會增加。但YouTube堅持認為,只有高質量的視頻才能吸引觀眾。3月,Deadline 報道稱,YouTube切斷了兩個使用AI製作虛假電影預告片的頻道的廣告。這些賬户無法在平台上賺錢,但它們可以繼續發佈內容。