中國提議為生成式人工智能模型制定培訓數據黑名單

Reuters

2023-10-12

人工智能詞語出現在這幅插圖中，拍攝於2023年3月31日。路透社/Dado Ruvic/插圖

北京，10月12日(路透社) - 中國已經發布了針對提供由生成式人工智能驅動的服務的安全要求，包括不能用於訓練AI模型的來源黑名單。

生成式人工智能，由OpenAI的ChatGPT聊天機器人的成功所推廣，學習如何從過去的數據中採取行動，並創建新內容，如文本或圖像，基於該訓練。

這些要求是由國家信息安全標準化委員會於週三發佈的，該委員會包括來自中國國家互聯網信息辦公室(CAC)、工業和信息化部以及警方的官員。

該委員會建議對用於訓練面向公眾的生成式人工智能模型的每個內容進行安全評估，其中包含“超過5%的非法和有害信息”的內容將被列入黑名單。

這樣的信息包括“宣揚恐怖主義”或暴力，以及“顛覆社會主義制度”，“損害國家形象”，以及“破壞國家統一和社會穩定”。

草案規定，中國互聯網上審查的信息不應該用於訓練模型。

該規定的發佈時間距離監管機構允許包括搜索引擎巨頭百度(9988.HK)在內的幾家中國科技公司向公眾推出其生成式人工智能驅動的聊天機器人僅有一個多月。

自4月以來，CAC表示希望企業在向公眾推出生成式人工智能服務之前向當局提交安全評估。

7月，網絡空間監管機構發佈了管理此類服務的措施，分析人士表示，這些措施遠不及4月草案中概述的措施繁瑣。

週三發佈的草案安全要求要求訓練這些AI模型的組織尋求個人同意，其中包括用於訓練目的的個人信息，包括生物識別數據。

他們還詳細闡述瞭如何避免知識產權侵犯的指南。

全球各國都在努力為這項技術設定監管框架。中國視人工智能為一項希望與美國競爭的領域，並計劃在2030年成為該領域的世界領導者。