YouTube成立20週年之際探討視頻中人工智能的未來 - 彭博社

Mark Bergen

2025-04-18

插圖：Adam Ferriss為彭博社創作

彭博社記者Mark Bergen在其著作 《點贊、評論、訂閲》（維京出版社，2022年）中記錄了YouTube成為現代傳媒沉睡巨頭的動盪歷程。此後，人工智能的蓬勃發展為這家視頻巨頭帶來了其20年發展歷程中最大的挑戰與機遇之一。在《下一章》欄目中，Bergen展望了AI時代YouTube的未來圖景。

YouTube副總裁Amjad Hanif近期會見了埃及網紅Farah Medhat，後者在海外擁有大量粉絲。Medhat在YouTube上的第二大受眾羣體位於韓國，當地粉絲通過字幕觀看她的阿拉伯語視頻。Hanif相信公司的人工智能技術很快能讓Medhat在屏幕上説一口流利的韓語，助她觸達更多觀眾。

他預計五年內，上傳至YouTube的每個視頻都能自動譯製成所有口語版本。每個單詞都將保留説話者的真實音色，嘴唇動作也會像母語者般自然重塑。這只是YouTube計劃為創作者眾多能力中的一項，據公司表述，旨在幫他們擴大受眾羣體。“您只需創作一次，我們負責讓全世界都能輕鬆觀看，“負責創作者產品的Hanif表示。他希望每位上傳者都能使用YouTube母公司Alphabet Inc.旗下谷歌的AI工具來構思創意、生成素材、剪輯視頻、進行營銷，最重要的是——提供視頻表現的細粒度數據，激勵他們發佈更多內容。

二十年前，YouTube首個視頻上線——那是聯合創始人賈韋德·卡里姆發佈的一段19秒的搞笑內容。這個視頻分享網站從最初與好萊塢和廣播電視對抗、雜亂無章且虧損的運營狀態，逐漸發展成為如今傲視羣雄的全球巨頭。在此過程中，它與數百萬內容創作者建立了深厚聯繫，其中許多是專業創作者，他們依靠這個平台謀生或為之奮鬥。

這種關係並不輕鬆：YouTube歷來在制定政策、版權規則和商業策略時，即使是最知名的創作者也鮮有發言權。然而，YouTube現在表示，人工智能（AI）將讓它的創作者大軍在媒體世界中佔據更大份額。這很公平，因為谷歌在開發自己的AI模型Gemini時，利用了無數小時的YouTube內容，而許多創作者並不知情。（YouTube發言人表示，公司使用視頻內容“是為了改善YouTube和谷歌上創作者和觀眾的產品體驗，包括通過機器學習和AI應用”，並且“符合創作者同意的條款”。）

成功故事

YouTube的規模比以往任何時候都大。儘管面臨來自Spotify、TikTok和電視流媒體的日益激烈的競爭，但去年其廣告銷售額達到了361億美元。研究公司MoffettNathanson估計，其訂閲和其他收入來源還貢獻了180億美元，該公司預測，明年YouTube將超越華特迪士尼公司，成為美國收入最高的娛樂企業。“這是一個驚人的成功故事，”廣告巨頭WPP Plc的首席執行官馬克·裏德説道。

高管變動並未減緩平台的發展步伐。2023年初，蘇珊·沃西基辭去首席執行官職務後，尼爾·莫漢接管了YouTube。（沃西基次年因肺癌去世）。作為2015年加入YouTube的谷歌廣告業務資深人士，莫漢在延續沃西基對本土創作者公開重視的同時，推動YouTube進一步深入主流媒體渠道。他大力進軍播客領域，接納了YouTube形形色色的右翼視頻博主；在2月的CEO公開信中，莫漢特別提到了喬·羅根對唐納德·特朗普的競選專訪。今年早些時候，YouTube宣佈其平台每月有10億人收聽播客，鞏固了在該類別對Spotify的領先地位。

莫漢將擴大電視屏幕收視率作為另一重點，藉助近期與NFL的合作，甚至吸引競爭對手的流媒體服務入駐YouTube應用。他還支持了艾美獎對超級YouTuber如Rhett and Link的提名。Rhett and Link所屬Mythical Entertainment總裁布萊恩·弗拉納根表示，YouTube與其"在收視率、變現、獎項、文化影響力等各方面被視同電視的雄心不謀而合”。

人工智能時代

2022年9月，我出版了著作《點贊、評論、訂閲》。兩個月後，ChatGPT橫空出世，掀起的生成式AI浪潮對媒體行業的衝擊力，堪稱YouTube問世以來之最。新興AI工具正讓人們以空前速度和低成本生產內容，互聯網充斥着以假亂真的模仿作品、深度偽造和明目張膽的剽竊。好萊塢並未熱情擁抱生成式AI——像病毒式傳播的偽造Drake單曲這類早期案例，其詭異能力被視為未來盜版氾濫的預兆。

面對搜索引擎業務遭遇的前所未有挑戰，谷歌也完成了自我重塑。但在視頻領域，這家公司擁有應對AI內容時代的充足籌碼。谷歌推出的VeoAI視頻工具，僅需在聊天框輸入指令即可生成影像。儘管OpenAI等公司已推出類似產品，但YouTube龐大的分發網絡意味着：即便創作者使用競品AI工具，谷歌仍是贏家——想要視頻被看見的人，終會將內容上傳至YouTube。

隨着AI生成內容的新浪潮湧現，YouTube與其他網絡平台一樣，在保持內容流量的同時努力應對版權問題。在這方面YouTube具有優勢：近二十年來，其運行的Content ID系統——這套龐大的軟件能檢測視頻中的版權素材，基本安撫了好萊塢和音樂產業。生成式AI興起後，YouTube迅速採取行動，與環球音樂集團和創新藝人經紀公司簽署協議，監控平台上未經授權的音樂人、運動員及演員AI替身。YouTube近期還將多位頂級網紅納入深度偽造防護計劃。創新藝人經紀公司戰略發展主管亞歷山德拉·香農表示，各科技平台處理深度偽造的持續性參差不齊：“必須承認，YouTube正引領着這一領域。”

但YouTube在解決生成式AI另一關鍵爭議——該行業通過未經許可抓取海量網絡數據得以發展——時卻顯得不夠果斷。如今的聊天機器人能撰寫像樣的郵件和詩歌，前提是它們經過訓練（通常通過採集大量網絡文本輸入語言模型的軟件程序）。以網絡爬蟲搜索起家的谷歌，對這一做法再熟悉不過。

ChatGPT問世後不久，眾多公司競相開發能生成圖像、語音和視頻的人工智能。YouTube成為了訓練數據的金礦。自2017年起，每分鐘至少有400小時的視頻被上傳，構建了一個無與倫比的檔案庫。《連線》與《Proof News》 報道稱，去年多家硅谷巨頭使用了包含數千個不知情YouTube頻道內容的訓練數據庫（報道中提及的公司之一Salesforce Inc.發言人表示該數據庫"公開可用且遵循寬鬆許可協議”）。該領域的版權問題仍處於灰色地帶，對許多YouTuber而言，企業似乎將YouTube視為免費開放的資源庫。

這種模糊性在去年OpenAI發佈AI視頻生成模型Sora時公開化。時任OpenAI技術總監的Mira Murati在《華爾街日報》採訪中被問及公司是否抓取YouTube訓練Sora時面露難色：“我確實不確定”。

一個月後，Mohan接受彭博社Emily Chang採訪時表示雖不瞭解OpenAI的具體操作，但強調YouTube禁止未經許可盜用視頻：“這是基本規則”。當被問及谷歌自身AI模型Gemini是否遵守此規則時，Mohan迴避了直接回答，僅表示公司使用YouTube內容"符合平台服務條款"。

這是個含糊其辭的回答。紐約時報去年報道稱，OpenAI故意使用YouTube數據訓練模型，部分谷歌員工知情卻因公司同樣行為而保持沉默。（YouTube發言人重申了莫漢關於未經授權抓取的聲明。OpenAI向《紐約時報》表示其依賴"多種數據來源"；這家初創公司發言人拒絕進一步置評。）

即便是頂級YouTuber和商業夥伴也難以弄清數據抓取詳情及YouTube的知情程度。“掩蓋此事符合他們的利益，“資深經紀人、Night經紀公司總裁埃茲拉·庫珀斯坦表示，“未來回顧時，這將被視為對所有內容的剝削。”

去年八月，資深YouTuber漢克·格林（深受平台青睞）就莫漢對張的回應發佈長視頻。根據YouTube服務條款，上傳視頻即授權平台使用內容"運營、推廣和改進"服務——格林指出該條款現在已包含訓練谷歌AI模型。他二十年前開始發佈視頻時，大語言模型根本不存在。“我當時根本不知道同意了這個，“視頻中憤怒的格林説道。

多年來，YouTube一直採用雙軌制運營模式。對於由唱片公司和傳統媒體機構運營的頻道（如泰勒·斯威夫特和吉米·法倫等名人），平台採用一套支付與合約管理方式；而對於構成平台主體的"獨立"創作者（如格林），則適用另一套規則。當谷歌開始研發生成式AI模型時，決定不使用YouTube媒體合作伙伴的內容進行訓練，但確實依據服務條款許可，使用了創作者的材料。

但公司從未明確説明這一點，也未透露OpenAI等機構的抓取程度。“以我的立場來看，這明顯是在剝削我，“格林在視頻中表示。

YouTube拒絕讓莫漢接受採訪。部分YouTube員工私下辯稱，谷歌比OpenAI等機構更負責任，因為它並未抓取全部YouTube內容。去年12月，YouTube推出新功能，允許創作者向第三方表明開放數據抓取。（該公司尚未公佈相關數據收集計劃，但發言人表示該功能不會改變服務條款。）

一批新興企業正試圖利用這類數據交易，在谷歌體系外建立市場，讓創作者可以向AI開發者出售閒置視頻素材。前YouTube員工、現Vermillio公司首席戰略官凱瑟琳·格蕾絲指出，這種模式旨在向內容生產者傾斜，為其開闢YouTube之外的收入渠道。她將這種模式與YouTube長期運行的版權系統對比：“這對所有人都公平嗎？誰獲得了萬億美元市值？是谷歌。”

YouTube高管哈尼夫證實，平台的數據訓練選擇加入條款不適用於谷歌自身模型。他向創作者解釋，接受服務條款的交換條件——即同意上傳至YouTube的內容可能用於訓練Gemini模型——意味着能使用公司最新功能，如自動視頻翻譯、評論智能回覆和觀眾數據分析AI工具。“我的解釋是，他們期待的許多功能都依賴於Gemini。“哈尼夫表示。

創意民主化

YouTube正與數十萬創作者測試AI配音技術，可將英語視頻即時轉換為八種其他語言（或反向轉換）。公司數據顯示，這些視頻超40%的觀看量來自配音語言觀眾。負責該功能的副總裁克里斯蒂安·厄斯特林稱，2025年YouTube有"非常雄心勃勃的擴展計劃”。目前正運行小規模試點，專注於配音聲音克隆技術，並試驗唇形同步重塑技術。未來該技術或應用於歷史影像甚至已故名人視頻片段。“這些都在考慮範圍內。“厄斯特林表示。

如MrBeast等頂級YouTuber已自費採用外部配音技術或聘請多語種配音演員。YouTube計劃免費提供這種"巴別塔"能力。人才經紀公司WME戰略主管克里斯·傑奎明用YouTube的標誌性詞彙形容，這類生成式AI功能將"實現創意民主化”。

許多創作者願意採用這類工具，如果它們能節省時間或金錢。但有些人並不情願完全擁抱AI。薩姆·貝雷斯（Sam Beres）是一位在其頻道上嘗試AI產品的創作者，他擔心配音會拖累收入，因為一些廣告商更看重英語國家的高觀看率。（YouTube發言人表示，將英語配音成其他語言的創作者可能會看到平均廣告價格“略有下降，而將其他語言配音成英語的創作者則相反”，並補充説“在這兩種情況下，觸及新觀眾都會增加他們的觀看量，因此在大多數情況下，他們的收入應該會增加。”）

一些YouTube頻道擁有鐵桿粉絲，他們認為AI是出賣或剝削創意工作者的標誌。“如果一個元素是由AI生成的，他們會立即攻擊你，”Mythical Entertainment的首席創意官史蒂維·温·萊文（Stevie Wynne Levine）説。“而且他們這樣做是對的。”

其他人則沒有那麼有原則。YouTube已經看到了大量AI生成的內容。只需在網站上搜索電影預告片；很明顯，分辨什麼是真實的變得越來越困難。

“我們已經有了數十萬，甚至數百萬的無面孔AI頻道，”歌手兼YouTuber彼得·霍倫斯（Peter Hollens）説，他預測AI頻道的數量只會增加。但YouTube堅持認為，只有高質量的視頻才能吸引觀眾。3月，Deadline 報道稱，YouTube切斷了兩個使用AI製作虛假電影預告片的頻道的廣告。這些賬户無法在平台上賺錢，但它們可以繼續發佈內容。