刷到差評君賣壯陽保健品?這次真得澄清一下了_風聞
差评XPIN-差评官方账号-用知识和观点Debug the world!09-05 09:16
前一陣子,我們突然發現了一個很離譜的事兒:在本人完全不知情的情況下,差評君的聲音,被偷去賣不可言説的保健品了。。。
與此同時,知危編輯部大餅的聲音,也被扒去做克隆了。。。
説起來有點抽象,不如咱閉上眼,聽聽這兩段音頻。
差友們可能根本聽不出來什麼區別,但上面的是咱們知危原聲,下面是別人搞的 AI 合成。
咱不是啥聲優,也不是名人歌手。可現在,逆天的 AI 已經能用 5、6 秒的樣本,復刻盜用任何一個普通人的聲音了。
看完了這些視頻,差評君和大餅都有點懷疑自己,是不是真幹過這個配音兼職,但這兼職費也沒到賬啊?
在這細思極恐的時刻,咱是真的很想知道,這玩意兒到底發展到啥地步了???

我們查了不少資料,發現 AI 聲音克隆雖然看起來剛成熟不久,變現的賽道上卻已經擁擠得很了。
首先,上游的工具準備階段,賣鏟子的老套路依然在賺。
聲音克隆的工具其實不少都是免費的,像 ElevenLabs、各種 github 開源模型等等。
材料也是免費的,從各個網站視頻裏扒名人大 V 的語音就行,只要 10 秒左右的高質量音頻,足夠後續任何內容的生成了。
教程,還是免費的。。。視頻平台上搜索一下 “ 聲音 ”,“ 克隆 ” 關鍵詞,相關的教程五花八門。從複雜的開源部署,到簡單的打開網頁一鍵生成,效果看起來一個比一個吊。

把這些免費的工具、素材、教程一塊打包,就能輕鬆賣個幾分十幾塊。
這些技術含量極低的玩意兒,少則賣幾十單,多的居然賣了兩百多單。

商品詳情頁普遍打着 “ 只要 x 秒樣本、相似度高達 90%+、定製任何語音、情感高度還原 ” 等等宣傳語,點進去就是一波焦慮營銷,號稱是做自媒體必備。

而到了下游,用 AI 聲音克隆做什麼樣的 “ 自媒體 ” ,才是真正賺錢的地方。
靠着這些素材和工具,利用明星的知名度和大夥兒的熱情,用 AI 克隆明星聲音,成了最快的起號辦法。
他們甚至還把防 gank 和吸粉的經驗總結起來,整出了聲音克隆界的千層套路。
來源:素之初私域

不想被封,就要用 “ 杭州薛之謙 ”、“ 東北權志龍 ” 這種擦邊賬號名;官方人物碰不得;絕對不要聲稱是本人。
想長期養號,就得多個明星聲音混剪、搞點方言,或者用老明星聲音釣魚網友懷舊情懷。。。
可以説,平台的雷區和爽點都被玩透了。
良心一點的,不拿去盈利倒也還好。像是用明星的聲音去翻唱各種歌,每天能發好幾首,最高點贊也上萬了。

更噁心一點的,就打着明星和家人的旗號,開始直播帶爛貨圈錢了。
比如前一陣子,央視也報道了聲音克隆的亂象。
有的視頻開局一張圖,再盜用體育明星的聲音,就能給 “ 家鄉 ” 各種農副產品做代言。一堆網友以為真是本人,紛紛下單支持,直接賣出去了 4.7 萬單。

收益全被灰產吃幹抹淨,風險卻甩鍋給明星本人。粉絲以為是偶像開新號,稀裏糊塗就關注了;消費者買到爛貨,罵聲全衝着正主去。
聲音的影響力,一點不比形象差。
我們也嘗試了一下聲音克隆,流程相當簡單。
不用花錢,也不用啥技術,有一個叫 NiceVoice 的網站,只要上傳一段原聲和目標文本,幾秒就能免費出結果:
而最難繃的是,克隆成本極低的另一面,AI分辨檢測成了昂貴、且很難完成的任務。
我們最先找到的是這個叫 AI Voice Detector 的網站,在沒有任何免費試用,效果未知的情況下,檢測 AI 聲音的價格最低是一個月 17.8 美元。

也就是説,別人花五十多終身使用,甚至免費搞出來的東西,我們要想去證明,每個月就要花一百多。。。
免費的檢測倒是也有,我們也找了幾個,可免費的 AI 聲音克隆各有各的吊,免費的 AI 檢測軟件各有各的拉。
我們用瀏覽器插件 Hiya 測了前沿部江江的真人配音和大餅的 AI 配音,結果 AI 得分 96,真人配音 87,小丑竟是我自己啊。

做聲音克隆出身的 Elevenlabs,即使有相關的技術積累也聽不出是 AI。

所以,為啥現在分辨AI聲音克隆這麼難?
造成這個局面的,一方面是因為 AI 聲音合成技術,已經今非昔比了。
現在的克隆技術,使用了大量的語音數據進行訓練,又把音色、情感、語調、節奏等等維度拆開建模,細節都能學得人味十足。
來自 Amanda de Andrade 博客

而與克隆技術飛速發展相對的另一面,檢測工具搞得實在太被動了。
他們要等新的克隆技術出現,花時間採集新數據,重新訓練模型,才可能有效。

矛和盾的不均衡發展,讓現在AI聲音克隆正在逐漸失控,背離發展的初心。
本來吧,它是用來幫助我們給自己發聲的。
像是咱這種搞媒體的,有了它就不用天天花那麼多時間去錄音修音了,一鍵生成,又快又省心。
對於一些發聲困難的人,AI 克隆更是他們重新説話的希望。像是演員李雪健老師,之前就通過 AI 幫助修復聲音,繼續表演創作。

可惜的是,這項剛剛成熟的技術,還沒等來完善的使用規範,就已經被濫用了。
我們也諮詢了法務馮律師,他****表示,根據 《 民法典 》 第 1023 條明確規定,自然人的聲音保護參照肖像權保護的規定。聲音作為人格權益的一部分,具有人身專屬性,未經許可不得擅自使用、複製或商業化利用。
然而,受害者的自證要比侵權麻煩得多。在這個守不住底線的互聯網,你的聲線也守不住了。
AI 聲音克隆,正在走向和 deepfake 換臉一樣的結局。

對於我們這些普通人來説,一些靠聲紋識別的安全技術,比如要念出來的驗證碼,以後還會有效嗎?
給銀行打的電話,他們還能確定是我本人嗎?
雖然現在聲音只是被盜去給視頻配音,倒是不算啥大事。但可以預見,我們距離這樣的電話已經很近了:
“ 是我是我,媽,我現在急需用錢,能先給我打 1 萬塊嗎?”
圖片、資料來源:
央視新聞、Github、Reddit、抖音、ChatGPT
https://arxiv.org/pdf/2312.01479
https://arxiv.org/pdf/2506.21619
https://arxiv.org/pdf/2508.02038
https://www.amandadeandrade.com/articles/ai-voiceover-versus-human-real-person-voice
