歐盟的新人工智能規定引發數據透明度之爭 | 路透社

Martin Coulter

2024-06-13

人工智能（AI）詞彙，機器人微型模型和歐盟旗幟在這幅插圖中可見，拍攝於2023年12月21日。路透社/Dado Ruvic/插圖倫敦，6月13日（路透社）- 歐盟關於人工智能（AI）使用的一套新法律將迫使公司更加透明地披露用於訓練其系統的數據，揭開了該行業中最為嚴密保守的秘密之一。

自微軟支持的OpenAI於18個月前向公眾展示了ChatGPT以來(MSFT.O)，人們對生成式人工智能產生了更多的公眾參與和投資，這是一組可用於快速生成文本、圖像和音頻內容的應用程序。但隨着這一行業的蓬勃發展，人們開始質疑AI公司如何獲取用於訓練其模型的數據，以及是否未經創作者許可就向其提供暢銷書籍和好萊塢電影內容是否構成侵犯版權。

歐盟最近通過的AI法案將在未來兩年內分階段實施，使監管機構有時間實施新法律，同時企業應對一系列新義務。但這些規則中的一些究竟如何在實踐中運作仍然未知。法案中更具爭議的部分之一規定，部署ChatGPT等通用AI模型的組織將不得不提供對訓練內容的“詳細摘要”。新成立的AI辦公室表示，計劃在2025年初與利益相關者磋商後發佈一個組織可遵循的模板。

儘管細節尚未敲定，但人工智能公司極力避免透露他們的模型是如何訓練的，將這些信息描述為商業秘密，如果公開將給競爭對手帶來不公平優勢。

“如果能看到競爭對手的數據集，同樣也讓他們看到我們的，那將是夢想成真，” AI 動力圖像編輯公司 Photoroom 的首席執行官 Matthieu Riouf 説。

他補充道：“這就像烹飪一樣。有一部分秘密食譜是最好的廚師不會分享的，那種讓它與眾不同的‘我不知道是什麼’。”

這些透明度報告最終會有多詳細將對小型人工智能初創公司和谷歌等大型科技公司產生重大影響(GOOGL.O) 和 Meta (META.O)，它們已將這項技術置於未來運營的核心位置。## 分享商業秘密

在過去的一年裏，包括谷歌、OpenAI 和 Stability AI 在內的一些知名科技公司面臨了來自創作者的訴訟，聲稱他們的內容被不當用於訓練他們的模型。

儘管美國總統喬·拜登簽署了一系列關注人工智能安全風險的行政命令，但關於版權的問題尚未得到充分測試。國會呼籲科技公司向數據的權利持有者支付費用得到了兩黨的支持。在受到越來越多的審查之際，科技公司已與媒體機構和網站簽署了一系列內容許可協議。OpenAI 與《金融時報》和《大西洋月刊》簽署了協議，而谷歌與 NewsCorp 達成了協議(NWSA.O)社交媒體網站Reddit。儘管採取了這些舉措，但OpenAI在三月份拒絕回答《華爾街日報》關於其視頻生成工具Sora是否使用YouTube視頻進行訓練的問題時，遭到了批評，該公司表示這將違反其條款和條件。

上個月，OpenAI因在公開展示最新版本的ChatGPT時使用了一位被描述為與女演員斯嘉麗·約翰遜本人“駭人聽聞”相似的AI生成聲音而遭到進一步抨擊。“駭人聽聞”，這位AI生成的聲音被描述為與女演員斯嘉麗·約翰遜本人“駭人聽聞”相似。領先人工智能初創公司Hugging Face的聯合創始人托馬斯·沃爾夫表示，他支持更大的透明度，但這種情緒並未在整個行業中得到共享。“很難知道結果會如何。還有很多事情有待決定，”他説。

整個歐洲大陸的資深立法者仍然存在分歧。

歐洲議會AI法案起草者之一Dragos Tudorache表示，AI公司應被迫公開其數據集。

“它們必須足夠詳細，以至於斯嘉麗·約翰遜、碧昂絲或任何人都能知道他們的作品、歌曲、聲音、藝術或科學是否被用於訓練算法，”他説。

一位委員會官員表示：“AI法案承認有必要在保護商業秘密的合法需求與促進擁有合法利益的各方，包括版權持有人，行使其在聯盟法律下的權利之間確保適當平衡。”

在法國總統埃馬紐埃爾·馬克龍的領導下，法國政府私下反對引入可能會影響歐洲人工智能初創企業競爭力的規定。

在五月份的巴黎Viva Technology大會上發言時，法國財政部長布魯諾·勒梅爾表示，他希望歐洲能成為人工智能的世界領導者，而不僅僅是美國和中國產品的消費者。

他説：“歐洲曾經創造了控制和標準，現在需要明白，你必須在制定規定之前進行創新。否則，你會面臨規定你沒有掌握的技術，或者因為你沒有掌握而制定不當的規定的風險。”

通過《在競選路上》新聞簡報，獲取關於美國選舉的每週新聞和分析，以及它對世界的影響。在這裏註冊。