看看語言學家如何分析劉強東涉嫌性侵案電話錄音 | 微思客_風聞
简单点-2019-04-26 14:19
來源: 微思客wethinker
編者按
近日,南方都市報發佈了一則由“匿名人士提供”的、據稱是劉強東涉嫌性侵犯案中劉強東律師與當事人女方的電話錄音。今日,“呈現小組”發佈了據稱是“完整電話錄音”的音頻資料。一瞬間,在視頻真偽風波之後,劉強東涉嫌性侵犯案再起疑團。針對南都的音頻以及“呈現小組”發佈的音頻,微思客特邀語言學愛好者“果子狸”從語音學角度粗析這兩則音頻材料,供讀者參考。
首先,需要科普一下兩個語音學上的概念。一個是聲波(waveform),一個是聲譜圖(spectrogram)。聲波是指聲源體發生振動引起周圍空氣振盪,振盪的方式就是聲波。例如,人在説話的時候,是通過聲帶振動發聲。發音“一”時的聲波跟“八”時的聲波是不一樣的。在聲波的基礎上,我們可以通過一些語音分析軟件獲取更多關於聲音的特質。例如,聲譜圖就是記錄聲音在一段時長內的頻率變化。“一”跟“八”不僅僅聲波不一樣,聲譜圖呈現的也不一樣。語音學家可以通過分析聲波以及聲譜圖來挖掘很多“隱藏在聲音裏的秘密”。
假設説,我們想知道,網上流傳的“南都音頻”是否真的如“呈現小組”的視頻裏指出的那樣,是被剪輯過的。我們可以通過分析“南都音頻”裏那23個剪輯點的聲波以及聲譜,或許能夠發現一些蛛絲馬跡。如果“南都音頻”是被剪輯過的,那麼必然會在聲波以及聲譜圖上留下破綻;反之,如果“南都音頻”裏是連貫的電話錄音,那麼聲波跟聲譜圖上也能呈現其連貫性。
分析方法
從網上下載兩則錄音,錄入到語音分析軟件Praat,分析其聲波以及聲譜圖(spectrogram)的聲音物理性質。兩則錄音皆由網上下載,可能會因為下載、壓縮過程中造成一定的音質受損,以下分析也是建立在音頻有可能音質受損的基礎上。

語音分析
“呈現小組”音頻裏列舉了“南都”音頻的23處剪輯點。以下分析會針對這23個剪輯點,看看從“南都音頻”裏是否能找到被剪輯過的痕跡,以及對比“呈現小組”版本的音頻,看看兩則音頻的差異在哪裏。
這個點是“南都音頻”的最開頭,無法判斷此處是説話人1與説話人2對話的開始或是兩人對話的截取片段。
對比“呈現小組”的音頻,在此點開始之前,有13秒的音頻,其中包括電話撥打的信號聲,以及説話人2接聽電話的應答聲。

在南都音頻裏,此處的前一句是説話人1在説 “I am an attorney at Caplan & Tamburino law firm”, 然後説話人1接着説“How can I help you?”。請注意,在説話1説完第一句話之後的那一段不規則聲波,顯示的是當時的背景噪音。但聲波在紅色箭頭處發生了變化,聲波的振幅稍微加大了一些,顯示背景噪音似乎更加大了。這一點也可以從聲譜圖裏黃色箭頭處看出,這一處的聲譜更加暗了。如果這兩句話是未經剪輯,是説話人1連貫説出來的話,背景噪音的聲波不應該有這樣的變化。因為在那個靜默的階段,背景噪音應該是相對一致的。當然不排除背景突然多了一些干擾,導致聲波變化。所以,“南都音頻”在這一點上剪輯的可能性,僅依據聲波以及聲譜圖上來看的話,是有可能的,但這個證據並不是太直接。
對比“呈現小組”音頻,在説話人1在説完“I am an attorney at Caplan & Tamburino law firm”,緊接着的是説話2的一段靜默以及詢問。

此處的剪輯痕跡比較明顯。根據“南都音頻“,此處是説話人1在説完“How can I help you?” 之後,靜默了一段時間,然後接 “I’m the attorney that you wanted to speak to. ”如果此處是未經剪輯的,在説話1接“I’m the attorney…”時,聲譜圖上不會出現紅色箭頭處的bar。這個bar更像是前面還有一些話,但在剪輯的是因為沒有辦法完全健掉而留下的痕跡。當語流非常快的時候,每個詞的發音並不是獨立的,是會受前後的詞的影響(例如連讀、coarticulation等)。所以,此處被剪輯過的可能性比較高。
對比“呈現小組”的音頻,此處前面還有一段説話人2與説話人1的對話。

此處剪輯痕跡非常明顯!根據南都音頻,此處是説話人1在表明自己身份“I’m the attorney that you wanted to speak to.” 之後,説話人2説:“I know the boss,right?…, his name is Liu…”. 當兩個並非連貫的音頻片段拼接一起的時候,因為不同聲音片段的頻率是不一樣的(即便是兩段white noise的拼接,也非常困難),拼接在一起時沒有辦法很自然地過渡 , 所以很容易出現這樣個一個gap。
對比“呈現小組”的音頻,此處前面還有一段説話人1與説話人2的對話:

根據“南都音頻”,此處是説話2在詢問説話人1當事人信息之後,説話人1説:“Go on, ma’am, I’m listening.”. 此處唯一疑似剪輯的地方是當説話人2完成説話之後,有很短的一段靜默,聲譜圖記錄了這段靜默時間內背景噪音的一些信息(紅色箭頭處)。而當説話人1接話的時候,從靜默到説話人2發聲之間的聲譜圖過渡不大自然。當然,這裏也有可能是受去躁音的影響。
對比“呈現小組”音頻,此處前面還有一段説話人1跟説話人2的短暫對話。

此處剪輯痕跡明顯。根據“南都音頻”,在説話人1表明“Go on, ma’am, I’m listening.”之後,説話人2接着説:“Now I want him to give me an apologize.” 露出馬腳的地方就在那個 “now”。一個未經剪輯的 “now”, 會在聲譜圖上呈現一個比較完整的鼻音[n]。而鼻音[n]是一個濁音,濁音在聲譜圖上的特徵是在聲譜圖最下邊有一個voice bar(紅色箭頭處)。但這個點的voice bar非常不自然,出現了像剪輯點3裏的“斷層”現象。所以,依此可以判斷,此處被剪輯過的可能性很高。
對比“呈現小組”的音頻,此處説話人2説的是:“OK…emm… Now I want him to give me an apologize.”

此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組“的音頻,此處説話人2説的是:

此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”的音頻,説話人2説完之後,説話人1接話。

此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”音頻,此處對話如下。

此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”的音頻,此處的對話如下。

此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”音頻,此處對話如下。

根據“南都音頻”,此處為第一段電話錄音的結束。緊接着第二段電話錄音的開始。此處無法判斷,第一段錄音是否在此處有刪減,也無法判斷此處是否真的為第二段錄音開始。
對比“呈現小組”音頻,第一段錄音在此處之後,還有一段説話人1與説話人2的對話。

另外,根據“呈現小組”的音頻,第二段錄音在此處之前,還有一段電話撥號信號音,以及一段説話人1與説話人2的對話。

根據“南都音頻”,此處是説話人1在説完“I’m just calling back to touch base and get what your proposal is.” 緊接着説話人1説“You had asked that you want to receive an apology and money. So my question to you is, what is your proposal for money?”在兩句話之間的靜默時間,聲波呈現出了不自然的波動,這個説明可能前後兩句話的背景噪音不一樣。情況類似剪輯點2. 此處有被剪輯的可能性。
對比“呈現小組”的音頻,此處兩人對話如下。

此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”音頻,此處刪除的是一段1秒鐘的沉默。
此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”音頻,此處刪除的是一段1.87秒鐘的沉默。
此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”音頻,此處刪除的是一段2.1秒鐘的沉默。
此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”音頻,此處刪除的是一段0.53秒鐘的沉默。
根據“南都音頻”,在説話人2説完:“I just wanna ask…ask about his proposal.” 之後,説話人1接話:“I’m gonna need a little bit of guidance from you.” 此處有嫌疑的地方是紅色箭頭處的陰影,像是friction,但是説話人1接話的“I’m” 是一個雙元音[ai]開頭, 不應該出現friction。這裏也可能是背景噪音導致。
對比“呈現小組”的音頻,此處對話如下。

此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”的音頻,此處刪減的是説話人2的一段語塞。
此處剪輯痕跡明顯。出現了“剪輯實錘のgap”。參考剪輯點4的分析。
對比“呈現小組”音頻,此處刪減的對話如下。

此處呈現了在紅色箭頭處的前後聲波以及聲譜圖都有一些不同,這可能是因為背景噪音發生了變化,也有可能是剪輯之後的結果。參考剪輯點2與剪輯點14的分析。
對比“呈現小組”音頻,此處説話人的對話如下。

此處為南都音頻第二段錄音的結尾。根據此點無法判斷,此處是否是第二段錄音的結束。
對比“呈現小組”音頻,此處之後,説話人1、2還有一些對話。

以上是根據“呈現小組”視頻裏指出的南都音頻23處疑似被剪輯處的語音分析。根據這些分析,我們不難得出**“南都音頻”是被剪輯過的**這個結論。
至於為什麼剪輯、哪些部分被剪輯掉,以及為什麼要剪輯掉這些部分,各位讀者可自行判斷。
可能也會有讀者質疑,為什麼果子狸不做一份對於“呈現小組”音頻的語音分析,是不是有所偏頗?歡迎各位民間高手下載“呈現小組”的音頻分析,然後有依有據地指出任何您覺得該音頻疑似被剪輯的部分。如果有這麼一份“呈現小組音頻疑似剪輯點清單”,微思客會應讀者要求,請果子狸出山,再做一份針對“呈現小組”音頻的語音分析,以示公允。