AI聊天機器人像ChatGPT吸收了大量數據版權持有者想要分一杯羹 - 彭博社

Ethan M Steinberg

2024-04-06

ChatGPT和其他聊天機器人如何生成文本、圖片和音樂，以與有才華的人類相媲美？通過吸收人們已經創作的內容，並識別材料中的模式，從而能夠產生新的東西。這些生成式人工智能平台已經吸收了19世紀的小説、節拍詩、草案合同、電影劇本、圖片散文、數百萬首歌曲等各種內容，成為自互聯網發明以來最具顛覆性的技術力量。

事實證明，這種對人類過去努力的廣泛搜索並非免費。新聞機構、小説家、音樂出版商等那些作品被輸入聊天機器人的大型語言模型作為訓練的人們正在要求分享利潤。

一些人已經與ChatGPT的所有者OpenAI達成協議，使用他們的作品。其他人正在起訴該公司和其他人工智能平台開發者在美國法院。結果將是對“合理使用”原則的一次考驗，該原則使得在某些情況下可以使用書籍、新聞報道、歌詞和其他受版權保護的材料而無需支付其創作者。

案例

至少有20起訴訟案件正在進行中，大多數在加利福尼亞州或紐約聯邦法院，針對人工智能公司。一些是由新聞機構提起的。其他涉及作者試圖從其故事的使用中獲得一些收入。

法律專家們最關注的案件之一是《紐約時報》在去年十二月底針對OpenAI及其投資者微軟公司提起的訴訟。該報要求高達4500億美元的賠償，聲稱OpenAI侵犯了其權利，使用時報文章開發ChatGPT。這起訴訟與其他案件不同之處在於，它還指控這款聊天機器人製造商在被提示時幾乎逐字複製時報文章。時報表示，雙方在提起訴訟前進行了數月的談判。OpenAI在一份駁回訴狀的動議中表示，投訴中引用的複述示例“非常反常規”，是聊天機器人中的一個錯誤。
另一起訴訟指控Facebook和Instagram所有者Meta Platforms Inc.非法複製了作家Sarah Silverman和Richard Kadrey的書籍用於其人工智能工具。
庫存照片供應商Getty Images聲稱其照片不應在未經許可的情況下被用來訓練由Stability AI擁有的圖像生成器Stable Diffusion。
在線新聞媒體The Intercept和Raw Story Media提起的一對訴訟指控OpenAI和微軟違反了1998年數字千禧版權法，因為他們在訓練ChatGPT的LLM時剝奪了受版權保護的信息。
倡導版權保護的作者公會也起訴了OpenAI，個別作者如Julian Sancton和Nicholas Basbanes也提起了訴訟。得到亞馬遜支持的人工智能初創公司Anthropic也因其使用歌詞來訓練其聊天機器人Claude而成為一起訴訟的被告。

什麼是“合理使用”？

合理使用被視為內置在美國版權法中的“安全閥”。

它旨在允許未經許可使用受版權保護的作品，只要這種使用在某種程度上有益於公眾。它還確保版權法遵守言論自由保護。例如，模仿通常受到合理使用的保護。

這項法律以其靈活性而著稱，確定在特定情況下是否適用合理使用的唯一方法是詢問一位聯邦法官。法官們依據四個標準，包括使用是否在某種程度上增加了原作品，以及是否給版權持有人造成了經濟損失。

他們還考慮作品的性質，包括它是虛構的還是基於現實事實的。

大多數其他國家沒有合理使用原則。一些國家，如英國，擁有更為有限的原則，而另一些國家，如日本，已通過法律豁免了人工智能訓練的版權責任。這可能威脅到長期以來被視為美國公司競爭優勢的東西。

最近，它被用來監管技術，比如在2005年作者協會對谷歌提起的一起案件。協會指控這家搜索巨頭的圖書平台通過在搜索結果中顯示已出版書籍的片段侵犯了版權。經過十年的訴訟，2015年，一位聯邦上訴法院法官做出了對這家科技巨頭的重大勝利，裁定谷歌僅以小節選自書籍，並且以一種變革性的方式使用。

‘公平使用’對AI平台來説是否是一種有效的辯護？

哈佛法學院的第一修正案學者兼教授麗貝卡·塔什內特表示，谷歌圖書案為對抗OpenAI提供了一些挑戰的最佳先例。該案認為創建數據庫是公平使用，因為整體大於部分之和，摘錄的使用增加了原作品的公共知識，而不是完全替代它們。

“創建訓練集的做法完全符合過去的公平使用標準，”塔什內特説道。不同之處在於，AI模型是否可以輸出大量與受版權保護的作品相似的文本，而不需要AI所有者為該作品付費。這一點尚未在法庭上得到驗證。

塔什內特和其他法律專家警告稱，將支持公平使用原則的個別裁決解讀為指導其他案件是有風險的，很大程度上取決於所討論平台如何攝取和使用受版權保護的內容。

一些主要新聞媒體已與AI公司達成許可協議，但更多個人作者選擇起訴，這表明為較小作品獲得有利可圖的交易存在挑戰。

潛在解決方案

在法庭上辯護的同時，AI公司繼續與出版商談判商業條款。這表明最終的裁決更有可能影響最終如何在對立方之間分配資金，而不是挑戰使用受版權保護作品訓練聊天機器人的實際原則。

回滾像ChatGPT這樣的工具可能會擾亂由美國公司主導的行業，這可能會帶來數千億美元的收入，而美國法官可能不願這樣做，據未參與案件的法律專家稱。如果判處賠償，他們表示不太可能達到數千億美元。

美聯社已經在2023年7月與OpenAI達成協議，許可其內容用於訓練ChatGPT，作為交換，但金額未披露。德國的Axel Springer 達成了一項價值數千萬歐元的類似新聞內容協議。該公司表示，聊天機器人對用户提示的回應將包括歸屬和完整文章的鏈接。

CNN、Fox和時代雜誌也已與OpenAI進行了談判，以許可其內容。

提起訴訟的個人作者尋求經濟賠償。例如，Basbanes要求每項他聲稱被侵權的作品賠償15萬美元。他還要求分享他聲稱OpenAI從使用他的作品中賺取的利潤。

對版權持有人有利的裁決可能會對無法負擔昂貴許可協議的較小AI初創公司造成傷害，從而給較大的參與者帶來潛在優勢。另一方面，像紐約時報這樣的申請人表示，如果讀者可以提示在線工具複製他們作品的部分內容，他們可能會失去一部分付費讀者。

“沒有正確答案，” 傑尼弗·詹金斯（Jennifer Jenkins）説，她是杜克大學的版權法專家和教授。“但如果歷史是一個指南，天空還沒有倒塌，我認為生成式人工智能系統不會消失。”