拜登假冒電話顯示AI語音克隆很容易上當 - 彭博社

Parmy Olson

2024-01-24

聽起來好像…

來源：彭博社

在瞄準英國、斯洛伐克和世界其他地方的政客之後，音頻詐騙者終於在美國引起轟動。他們克隆了總統喬·拜登的聲音，並將其製作成了自動撥號電話，這是上世紀70年代的一種競選策略。

歡迎來到2024年，你在電話中聽到的政治聲音可能是在互聯網上捏造的。

週末時，這條自動電話消息在播放時引起了選舉專家的警惕，它播放了一段經過編輯的聲音，聽起來就像拜登，並告訴新罕布什爾州的居民不要在週二的民主黨初選中投票。“把你的選票留到11月的選舉中使用，”它説，並附上了拜登的口頭禪：“真是一派胡言。”（點擊此處查看詳情）

虛假信息研究人員對所謂的音頻深度偽造在大選年初出現感到擔憂，因為全球大約一半的人口將進行投票。雖然虛假視頻和圖片引人注目且戲劇性，但虛假音頻剪輯更加危險。可以把它們看作是虛假信息的蚊子。它們小巧且易於製作，難以發現並且幾乎不可能追蹤。它們可以傳播錯誤信息，造成災難性的影響。例如，去年，斯洛伐克的一個政黨很可能因為其領導人的音頻深度偽造在選舉前兩天走紅而輸掉了國家選舉。

政府對這個問題非常清楚。拜登本人去年底簽署了一項行政命令，試圖引導人工智能的發展，而不會讓公眾面臨風險。但是魔鬼已經出籠。已經有數十家公司提供工具來克隆任何聲音，包括你自己或其他人的聲音，有些公司對偽造更加嚴格。

例如，一家名為Synthesia的英國人工智能公司銷售軟件，用於製作真實人物的語音和視頻克隆，通常用於製作企業培訓視頻，並禁止客户生成政治或新聞內容。當客户嘗試生成他們的克隆視頻時，一組內容審核員會在視頻完全生成併發送給用户之前觀看視頻，以確保它不違反這些規定。

但其他公司不會監管客户製作的內容。另一個名為HeyGen的工具上週在社交媒體上走紅，有人使用它修改了西班牙語演講的達沃斯演講，阿根廷總統哈維爾·米萊。它不僅展示了他用流利的英語説話，並且他的嘴唇與翻譯的詞語相配。然而，HeyGen依賴客户獲得克隆其他人聲音的許可，包括政治人物。

邁萊的視頻吸引了一大批欣賞的觀眾，但如果他的話被誤解，情況可能會變得不同。而HeyGen公司的技術將責任推給客户，似乎比Synthesia公司更容易被濫用。HeyGen公司沒有回應多次要求發表評論。

一些人工智能公司發現自己陷入了一場阻止人們濫用其系統的遊戲。ElevenLabs是最受歡迎的人工智能語音生成服務之一，用於翻譯有聲書或播客，去年在網絡論壇4chan的人們濫用其系統後，加強了執法力度。用它製作了艾瑪·沃特森、喬·羅根和其他名人説種族主義言論的深度偽造聲音。

即使所有人工智能公司嚴格監管音頻深度偽造的製作，惡意行為者仍然可以轉向提供更多自由的開源替代方案。這樣的替代方案有很多。最近的項目之一是來自麻省理工學院（MIT）、清華大學和人工智能初創公司MyShell的研究人員開發的一個名為OpenVoice的語音克隆工具。該工具允許任何人“僅使用小音頻剪輯”就能以“無與倫比的精度”克隆聲音，其創作者在X上表示。

美國聯邦貿易委員會最近承諾獎勵25000美元給任何能提出可行解決方案的人，解決AI語音克隆的問題。到目前為止，沒有技術修復，因為虛假信息專家表示，用於區分克隆聲音的新軟件仍然不可靠。

拜登的自動撥號電話突顯了一個令人警醒的現實，這對於虛假信息專家、其他國家和政治領導人來説早已顯而易見，他們一直受到AI生成的聲音的攻擊。由於各種政策、像Facebook這樣的平台的執行規則非常寬鬆，以及欺詐者可以毫不受約束地使用越來越多的免費工具，聲音克隆將會增加，我們的機構將不得不應對混亂。

目前，可能很長一段時間內，責任將再次落在我們身上，我們需要對所聽到的內容更加具有對抗性和謹慎性，即使是在我們自己的手機上。

更多來自彭博觀點：

AI不是唯一的虛假信息罪魁禍首值得擔憂：Parmy Olson
隨着特朗普的勝利歲月靜好：編輯委員會
誰想成為萬億富翁？：Tyler Cowen

想要更多彭博觀點嗎？ OPIN <GO>****。或者你可以訂閲 我們的每日新聞簡報**。**