《紐約時報》在對開放AI和微軟的訴訟中佔據優勢-彭博報道
Noah Feldman
只是試圖保持活着。
攝影師:Mario Tama/Getty Images/Getty Images
紐約時報對OpenAI和微軟提起的侵犯版權訴訟將傳統媒體機構與新技術提供者對立起來。象徵性地,這個案件承諾了巨頭之間的衝突:人力新聞採集與由人工智能產生的信息之間的對抗。但在法律上,這個案件代表了不同的東西:傳統法律與新興技術之間的滯後現象。
版權法是一套可以追溯到印刷機時代的規則,它並不是為了覆蓋ChatGPT這樣的大型語言模型而設計的。法院將不得不有意識地對其進行演變,或者由國會進行修正,以適應我們當前的情況。
案件中的關鍵法律問題將是被稱為公平使用的原則。在1976年版權法案中被編纂,公平使用告訴你何時可以使用他人版權的文本。公平使用測試有四個因素。 教育和非營利性使用更有可能被認為是公平使用。創意作品比技術寫作或新聞獲得更多的版權保護。被複制的作品的數量很重要,被複制的材料對被複制的作品的核心性也很重要。對於時報的訴訟來説,法院還會考慮複製是否會損害被複製作品的現在或未來市場。
一旦你瞭解了法律,你就可以大致猜測案件中的法律論點會是什麼樣的。《時代》將指出用户向ChatGPT或必應提問,它們回覆的內容與《紐約時報》的文章非常相似的例子。該報將觀察到ChatGPT是商業的一部分,並收取訪問其最新版本的費用,必應是微軟業務的核心部分。《時代》將強調新聞業的創造性方面。最重要的是,它將主張,如果你可以向由LLM驅動的搜索引擎詢問當天的新聞,並直接從《紐約時報》獲取內容,這將嚴重損害甚至可能摧毀《時代》的商業模式。
這些觀點大多是合理的法律論點。但OpenAI和微軟將為此做好準備。他們可能會回應説,他們的LLM並不是複製;相反,它是學習並進行統計預測以產生新的答案。如果我讀了《紐約時報》的一篇文章,然後就同一主題寫了一篇彭博觀點專欄,那並不構成侵犯版權,儘管我可能從《時報》那篇文章中學到了很多,並依賴那些信息來形成自己的觀點。因此,許多版權專家一直在推測,LLM從現有的在線材料中學習,即使這些材料受版權保護,也不可能構成版權侵權。被告還可以預計會主張新聞由事實組成,因此應該比創造性材料更寬容地對待。
但微軟和OpenAI將很難反駁最後一點 —— 他們的產品依賴於《時代》等新聞業務,將損害這些企業。ChatGPT和其他LLM無法走出去收集和審核新的事實。在可預見的未來,它們受限於從已經發表的信息中“學習”。
由此可見,要使LLMs提供有用的信息,必須有其他人 — 也就是人類LLM — 首先收集信息,確定其準確性,然後發佈。這就是新聞採集的本質。要做到這一點是很昂貴的。
更重要的是,為了知道我們可以依賴新聞,我們需要它來自一個我們可以信任的機構 — 一個有着良好記錄和商業利益的聲譽。否則,我們將不會有新聞。我們將會有一個與現實脱節的迭代迴音室。
這就是公共利益在維護新聞自由方面與公平使用問題相關的地方。如果你可以從LLM那裏以比從《紐約時報》更便宜的方式獲取信息,你可能會取消訂閲。但如果每個人都這樣做,就根本不會有《紐約時報》了。換句話説,OpenAI和微軟需要《紐約時報》和其他新聞機構的存在,才能作為其服務的一部分提供可靠的新聞。因此,從理性和經濟的角度來看,他們應該有義務為他們使用的信息付費。
將這種強大的公共利益納入版權法將對法院來説並不簡單。直接複製是最容易懲罰的侵權形式。在普通的法律情況下,如果LLMs改變了足夠的詞語以進行概括而不是複製,那就削弱了《紐約時報》的案件。然而,用不同的詞語進行概括仍足以摧毀《紐約時報》和類似的組織 — 並讓我們失去新聞。
法院將需要對所有這些保持敏感。如果他們做不到,國會將不得不採取行動。新聞基礎設施已經搖搖欲墜。如果我們徹底摧毀它,民主將是輸家。
更多彭博觀點:
- 神秘的聊天機器人開發者正在犯一個大錯誤:戴夫·李
- 不要讓ChatGPT寫太多粉絲小説:斯蒂芬·卡特
- 在揭開人工智能黑匣子方面邁出了一小步,但這是受歡迎的:帕米·奧爾森
想要更多彭博觀點嗎?OPIN <GO>。 或者訂閲****我們的每日新聞簡報。