YouTube與AI:平台欲借創作者數據確保成功——彭博社
Mark Bergen
插圖:Adam Ferriss 為彭博社創作
彭博社記者馬克·伯根在其著作《YouTube:全球超級力量》(Droemer Knaur出版社,2022年)中記錄了YouTube從動盪發展到成為現代媒體沉睡巨頭的歷程。自那時起,人工智能熱潮為這家視頻巨頭帶來了其20年曆史中最大的挑戰與機遇之一。本文中,伯根展望了AI時代下YouTube的未來。
YouTube副總裁阿姆賈德·哈尼夫近期會見了在海外擁有大量粉絲的埃及網紅法拉·梅達特:梅達特在YouTube上的第二大觀眾羣體來自韓國,當地粉絲通過帶字幕的阿拉伯語視頻觀看她的內容。哈尼夫認為,公司的AI模型很快就能讓屏幕中的梅達特説一口流利韓語,從而吸引更多觀眾。
他預估五年內,YouTube上每個上傳視頻都能自動同步所有口語語種。每個單詞都將以説話者的真實聲線呈現,其唇部動畫效果將如同母語者般自然。
據官方透露,這只是YouTube計劃為內容創作者提供的眾多功能之一,旨在幫助他們拓展受眾羣體。
“只需一次投入,我們就能輕鬆觸達所有人。”負責創作者產品的哈尼夫説道。他期望每位在YouTube上傳內容的人都能利用YouTube母公司谷歌(或其控股公司Alphabet)的AI工具來生成創意、製作素材、剪輯視頻、進行營銷,以及——或許最為關鍵——獲取詳細的視頻表現數據。這一切旨在激勵用户發佈更多內容。
20年前,YouTube首個視頻上線——一段由德美聯合創始人賈韋德·卡里姆拍攝的19秒搞笑片段。自此,這個視頻分享網站從與好萊塢及電視行業交戰、雜亂無章且虧損的企業,成長為全球巨頭。在此過程中,YouTube與數百萬內容創作者建立了緊密聯繫,其中許多人依靠平台謀生或至少以此為志向。
這段關係充滿張力:YouTube過去制定政策、版權規則和商業策略時,甚至未曾諮詢其最耀眼的明星創作者。但如今YouTube表示,AI將讓無數創作者對媒體世界產生更大影響力。這倒也公平,畢竟谷歌開發自有AI模型Gemini時,基於無數小時的YouTube內容訓練,而多數創作者對此毫不知情。(YouTube發言人聲明,公司使用視頻內容“通過機器學習和AI應用等方式,提升YouTube和谷歌上創作者與觀眾的體驗”,且“遵循創作者同意的條款”。)
成功故事
YouTube比以往任何時候都更強大:雖然面臨來自Spotify、TikTok和電視流媒體服務日益激烈的競爭,但去年仍實現了361億美元的廣告收入。根據MoffettNathanson分析師估計,訂閲和其他來源還帶來了180億美元的收入。他們預測,YouTube明年將超越華特迪士尼,成為美國收入最高的娛樂公司。廣告控股公司WPP的首席執行官馬克·裏德表示:“這是一個令人難以置信的成功故事。”
領導層的變動並未阻礙平台發展。2023年初,Neal Mohan接替辭去CEO職務的Susan Wojcicki,開始領導YouTube。(Wojcicki次年因肺癌去世。)Mohan是谷歌廣告業務的資深人士,2015年加入YouTube,他延續了Wojcicki對YouTube創作者的公開關注,同時帶領平台更深入地進軍大型媒體渠道。他大力推動了播客領域的發展,並熱情接納了YouTube上形形色色的右翼視頻博主。在2月份的CEO公開信中,Mohan讚揚了Joe Rogan在特朗普競選期間對他的採訪。2月,YouTube宣佈,每月有10億人在平台上觀看播客,這使該公司在這一類別中擴大了與Spotify的領先優勢。
莫漢通過與美國國家橄欖球聯盟(NFL)簽署協議,甚至為YouTube應用爭取到競爭性流媒體服務,將電視屏幕前的更大觀眾羣列為另一優先事項。此外,他還支持了如瑞特與林克等超級YouTuber的艾美獎競選活動。神話娛樂(瑞特與林克所屬工作室)總裁布萊恩·弗拉納根表示,YouTube懷抱着"在收視率、貨幣化、獎項和文化影響力等所有方面都被視為電視的雄心"。
AI時代
2022年9月,我出版了著作*《YouTube:全球超級力量》*。兩個月後,ChatGPT問世,引發了生成式AI的爆發,這可能會像YouTube誕生以來那樣徹底改變媒體世界。
藉助新的AI工具,人們已經能夠比以往更快、更經濟地製作內容,導致互聯網充斥着令人信服的模仿品、深度偽造和明顯的剽竊作品。好萊塢對生成式AI並不十分熱情。很快,就出現了令人不安的實例展示當前技術能力——比如病毒式傳播的逼真偽造德雷克歌曲,這些被視為盜版氾濫的前兆。
谷歌也進行了自我革新,以應對其搜索引擎迄今面臨的最大挑戰。然而,這家公司為AI視頻時代做好了充分準備:谷歌發佈了名為Veo的自研視頻AI,只需向聊天機器人輸入指令即可生成影片素材。此舉效仿了OpenAI等公司的類似產品——但憑藉YouTube龐大的分發網絡,即使創作者使用競品AI工具,谷歌仍能獲益。想要視頻獲得曝光的人,依然會選擇在YouTube發佈內容。
面對AI生成內容的新浪潮,YouTube與其他網絡平台一樣,試圖在保持收入流的同時解決版權問題。YouTube在此具有優勢:近二十年來,該公司運營着*Content ID——*一個能識別視頻中受版權保護素材的龐大軟件系統,該系統已基本平息了好萊塢和音樂產業的不滿。生成式AI突破後,YouTube通過安撫合作伙伴,與環球音樂和創新藝人經紀公司達成協議,對平台上未經授權的音樂人、運動員及演員AI虛擬形象進行審查。YouTube近期還邀請頂級網紅參與深度偽造防護計劃。創新藝人經紀公司戰略發展主管亞歷山德拉·香農表示,科技平台處理深度偽造的力度參差不齊。“YouTube是行業標杆。我只能説這麼多”,她補充道。
然而,對於生成式人工智能的另一項核心批評——該行業通過擅自抓取互聯網海量內容而發展壯大——谷歌並未展現出同等堅決的回應。當今的聊天機器人唯有經過訓練才能撰寫得體的郵件和詩歌,而這種訓練通常依賴於收集海量網絡文本並輸入語言模型的軟件程序。以爬取互聯網起家的谷歌,對這種操作再熟悉不過。
ChatGPT面世不久後,眾多企業競相投入生成圖像、語音和視頻的AI研發。YouTube成為訓練數據的金礦:自2017年起每分鐘至少有400小時視頻內容被上傳,形成了獨一無二的資料庫。《連線》與Proof News 報道稱,多家硅谷巨頭使用了包含數千個不知情頻道內容的訓練數據庫。(報道提及的公司之一發言人表示,該數據庫屬公開資源且遵循寬鬆許可協議。)該領域的版權問題仍是灰色地帶——對許多YouTuber而言,科技公司似乎已將YouTube視為其本質上的免費開放平台。
這種模糊性在去年OpenAI發佈其AI生成視頻模型Sora時公之於眾。當時OpenAI的首席技術官Mira Murati去年三月接受《華爾街日報》採訪時被問及公司是否為了Sora而爬取YouTube內容。她面露難色地回答:“實際上我也不確定。”
一個月後,YouTube首席執行官Mohan向彭博社的Emily Chang表示,雖然假裝不瞭解OpenAI的具體操作,但強調YouTube不允許企業在未經同意的情況下使用視頻。“這是基本規則,“他説。當被問及谷歌自己的AI模型Gemini是否遵守這些規則時,Mohan予以否認,稱其公司使用YouTube素材"符合平台服務條款”。
這是個狡猾的回應。《紐約時報》曾報道OpenAI故意使用YouTube數據進行訓練,且部分谷歌員工知情卻保持沉默——因為谷歌也在做同樣的事。(YouTube發言人引述了Mohan此前關於未經授權數據抓取的聲明,OpenAI則向《紐約時報》表示其依賴"多種數據來源”,該初創公司發言人拒絕進一步置評。)
即使是頂級YouTuber和商業夥伴也難以獲取關於誰抓取了什麼內容以及YouTube知曉哪些情況的明確信息。“他們有意掩蓋此事,“資深YouTuber經理兼Night人才機構總裁Ezra Cooperstein表示,“日後回顧時,我們會將這種行為視為對所有內容的剝削。”
2024年8月,資深YouTuber兼平台寵兒Hank Green發佈長視頻回應Mohan對Chang的答覆。根據YouTube服務條款,上傳視頻即授予平台"為運營、推廣和改進服務"使用該素材的許可——Green指出,該條款現在已涵蓋谷歌AI模型的訓練。當他開始向YouTube投稿時(以及此後二十年間大部分時間),大型語言模型尚未出現。“我從未同意過這種用途,“Green在視頻中憤慨表示。
多年來YouTube一直採用雙軌制系統。唱片公司和傳統媒體機構旗下頻道(如Taylor Swift和Jimmy Fallon等明星)的付款與合同採用特定方式管理,而佔據平台主流的"獨立"創作者(如Green)則適用另一套規則。當谷歌開始開發生成式AI模型時,決定不使用YouTube媒體合作伙伴的內容進行訓練,而是依據服務條款採用創作者素材。
然而,該公司從未對此作出澄清。OpenAI或其他公司進行數據抓取的範圍也未被公開。“在我看來,我顯然是被欺騙了,”格林在他的視頻中説道。
YouTube拒絕安排與莫漢的採訪。一些YouTube員工私下辯稱,谷歌比OpenAI和其他公司表現得更有責任感,因為它沒有收集YouTube上的所有數據。去年12月,YouTube推出了一項功能,允許創作者告知第三方他們是否同意抓取其數據。(該公司尚未公佈其數據收集計劃,但一位發言人表示,該功能不會改變使用條款。)
新一代公司正試圖從這些數據交易中獲利,並在谷歌之外建立市場,讓創作者可以向AI開發者出售舊有或未使用的素材。前YouTube員工、現為數據經紀公司Vermillio首席戰略官的凱瑟琳·格蕾絲表示,這種模式旨在將重心轉向內容生產者,為他們提供YouTube之外的收入來源。她將這種方法與YouTube長期以來的版權系統進行了對比。“這對所有人都有好處嗎?”格蕾絲問道,“誰獲得了這數萬億美元的市場價值?谷歌。”
YouTube經理哈尼夫證實,YouTube的訓練數據選擇加入功能不適用於谷歌自己的模型。他向創作者解釋説,通過接受使用條款(即同意他們在YouTube上發佈的內容可用於訓練Gemini),他們將獲得公司最新的AI功能,如自動視頻翻譯、評論建議回覆和觀眾數據的AI分析。“我是這樣解釋的:許多讓他們興奮的功能都基於Gemini,”哈尼夫説。
創意民主化
YouTube目前正與數十萬創作者測試一項AI配音技術項目,可將英語視頻即時翻譯為八種其他語言(或反向操作)。該公司數據顯示,這些視頻超40%的播放時長來自觀看配音版本的觀眾。負責該功能的副總裁Christian Oestlien表示,YouTube制定了"真正雄心勃勃的目標"計劃在2025年擴大此服務。當前正在運行一個專注於克隆配音聲線的小型試點項目,並試驗唇形同步動畫技術。未來YouTube可能將該技術應用於存檔視頻甚至已故名人片段。“這些都有可能實現”,Oestlien説道。
部分YouTube頂流如MrBeast已投資外部配音技術或僱傭多語種配音演員。YouTube計劃免費提供此功能。人才經紀公司WME戰略主管Chris Jacquemin認為,這類生成式AI功能將"民主化"創意——他使用了YouTube最鍾愛的動詞之一。
許多創作者願意使用這類節省時間金錢的工具。但部分人對完全接納AI仍存顧慮。在個人頻道試驗AI產品的創作者Sam Beres擔憂,配音可能減少收入,因為某些廣告主更看重英語國家觀眾數。(YouTube發言人表示,英語轉其他語言配音的創作者可能面臨廣告均價輕微下滑,而反向配音者則相反。他補充説明,兩種情況下新受眾的觸達都會提升觀看量,因此多數創作者收入仍將增長。)
一些YouTube頻道擁有忠實粉絲,他們視AI為剝削創作者的象徵。“哪怕內容中僅含有一絲AI生成的元素,他們就會立刻攻擊你,“Mythical Entertainment的首席創意官Stevie Wynne Levine説道,“而且這合情合理。”
其他人則沒那麼堅持原則。YouTube已經湧現大量AI生成內容。只需在網站上搜索電影預告片——越來越難分辨真假。
“我們已經看到數十萬甚至數百萬個無面孔的AI頻道,“歌手兼YouTuberPeter Hollens表示,他預計AI頻道數量還會持續增長。但YouTube聲稱,只有高質量視頻才能贏得觀眾青睞。三月,《Deadline》報道YouTube已停止為兩個使用AI製作虛假電影預告片的頻道投放廣告。這些賬號雖無法在平台盈利,但仍可繼續發佈內容。
原文標題:YouTube欲借創作者數據贏得AI時代:下一篇章