AI一本正經地胡説八道 有種辦法可以識破它_風聞
月舞之音-自由撰稿人-科普类公众号:月舞知音1小时前
近年來,生成式人工智能(AI)在文本、圖像、音樂等多個領域展現出了驚人的創造力和應用潛力。然而,隨着AI技術的不斷進步,其生成的內容越來越難以與人類創作區分開來,這引發了人們對於信息真實性和可靠性的擔憂。特別是在文本領域,AI生成的文本不僅行文嚴謹、語氣措辭得當,甚至能模擬官方通報的格式,使得虛假信息的傳播風險顯著增加。為了應對這一挑戰,Google DeepMind研究團隊在《自然》(Nature)雜誌上發表了一項重要研究,提出了一種名為SynthID-Text的文本水印方案,旨在提高AI生成文本的檢測精度。
AI生成的內容在文本、圖像和音樂中各有其特點,但文本生成技術因其高度發達和難以直接添加水印而尤為棘手。與圖像和音樂不同,文本中的每一個字符都是完全可見的,且可用於訓練AI的文本數據遠多於圖像和音樂。這使得AI在模擬人類表達方式和語言習慣方面取得了顯著進步,生成的文本在整體上效果極佳,但具體到細節時可能暴露出非自然的特徵。然而,這些非自然特徵往往難以被肉眼察覺,因此需要通過技術手段進行檢測。

現有的主流檢測方法主要分為事前檢測和事後檢測兩大類。事前檢測可以進一步分為基於水印的檢測和基於檢索的檢測。基於水印的檢測通過在AI生成的文本中隱藏某些信息以便後續檢測,但由於文本的離散性,添加水印比圖像和音樂中更加困難。常用的方法包括讓AI生成的文本使用特定的語言風格或偏向性地使用某些詞彙,但這可能會降低文本的質量。基於檢索的方法則是將AI生成的文本保存在數據庫中,通過匹配目標文本與數據庫中的文本來檢測其是否為AI生成。然而,這種方法需要保存用户數據,可能引發隱私泄露的問題。
事後檢測則不需要在文本生成時添加任何信息,而是根據AI生成文本的特點進行檢測。基於零樣本學習的檢測利用AI生成文本傾向於使用常見詞彙、句子長度和結構更加統一等特點來區分AI生成文本和人類創作文本。然而,隨着AI技術的不斷進步,這種方法的準確性正在逐漸降低。基於訓練的檢測則是使用人類創作的文本和AI生成的文本構建一個數據集,訓練一個分類器來識別AI生成的文本。但這種方法需要收集大量數據用於訓練,且隨着AI能力的提升,分類器的準確性也會受到影響。
為了克服這些挑戰,Google DeepMind研究團隊提出了SynthID-Text水印技術。該技術基於之前的水印生成組件,但使用了一種新的“錦標賽採樣”方法。通過這種方法,可以在不扭曲文本質量或僅輕微扭曲文本質量的情況下添加水印。在錦標賽採樣中,模型根據隨機數種子生成多個水印函數,並從詞彙分佈中採樣出多個詞彙進行競賽。每一輪競賽中,由水印函數決定勝出者,最終勝出者作為模型的輸出結果。由於詞彙是根據水印函數的偏好採樣得出的,因此添加水印的文本會在水印函數上有更高的評分。在檢測時,只需評估每個詞彙在對應水印函數下的評分,並將評分加和即可得到文本包含水印的可能性。
SynthID-Text水印技術的優點在於它可以在不顯著降低文本質量的情況下提高水印的檢出率。通過改變採樣方法實現水印的添加,雖然會改變模型輸出下一個詞彙的分佈,但由於使用了隨機數種子進行平均處理,可以得到與原始分佈相同的結果。因此,在適當的配置下,SynthID-Text可以避免影響詞彙分佈從而保證文本質量。同時,該技術不會產生太多的時間和計算開銷,可以被大規模地應用於生產實踐之中。
儘管如此,SynthID-Text水印技術仍然為檢測AI生成文本提供了一種可能的解決方案。隨着生成式人工智能的普及和應用的深入發展,如何檢測AI生成的內容將變得越來越重要。水印技術作為一種事前檢測方法,具有潛在的大規模應用前景。然而,要徹底解決AI生成內容的檢測問題,還需要各方共同努力。一方面,需要不斷研究和改進水印技術,提高其有效性和可靠性;另一方面,需要建立相關的行業標準和法律法規,規範AI技術的使用和發展。只有這樣,才能確保AI技術走在為人類服務的正軌之上,為社會的繁榮和發展做出更大的貢獻。