當機器能讀懂你的情緒,你會向它傾訴嗎?_風聞
TechEdge科技边界-2019-07-09 22:29
21世紀頭十年,美國發動了阿富汗和伊拉克兩場戰爭,其中在伊拉克的美國士兵死亡人數超過了自越南戰爭以來的任何一次戰爭。而活着回家的人也多多少少留下了揮之不去的心理陰影,越來越多活着回來的退伍軍人自殺身亡。根據退伍軍人管理局全美自殺數據報告,退伍軍人自殺人數曾一度超過每年6000人。
為了解決這場“人造悲劇”,幫助保護患有創傷後應激障礙的退伍軍人,早在2008年,亞馬遜 Alexa AI 部門的首席科學家Rohit Prasad就領導了一項計劃,協助美國國防部高級研究計劃局(DARPA)使用人工智能從退伍軍人的聲音中瞭解他們的心理健康狀況。
除此之外,該項目還通過觀察非正式交流或其他模式,專注於從患有創傷後應激障礙、抑鬱症或自殺風險的退伍軍人的聲音中發現他們的痛苦。
Prasad上個月在亞馬遜的 re: Mars 會議上接受採訪時説:“我們一直通過傳感器觀察士兵的語言、講話、大腦信號和感官,以確保在他們回家前就能接收到這些信號,從而做到早發現早治療。”
為了這個項目,DARPA 與 Cogito 等公司合作,後者與美國退伍軍人事務部(u.s. Department of Veteran Affairs)合作,當它認為一名退伍軍人的聲音有問題時,就會通知醫生。
Prasad説:“這是一個由心理學家組成的團隊,他們對這個問題非常熱衷,DARPA 的關注意味着我們有資金。”他補充説,“這個任務是儘可能多地拯救生命,這是我不捨離開的原因。”
Alexa 的“情緒”項目已經進行多年了。2017年,Prasad 對媒體講,亞馬遜開始探索情感識別的人工智能,但只能從用户的聲音中感受到一些負面的信息。
亞馬遜的 Alexa 人工智能團隊目前正在試驗探測快樂和悲傷等情緒的方法,這項工作在今年早些時候的研究中發表。據彭博社報道,亞馬遜正在開發一種可佩戴的情感檢測設備,人們可以用它來了解周圍人的感受。
“現在談論它將如何應用還為時過早,我們已經在線下探索瞭如何使用它來進行數據選擇,但是在這一點上我們還不方便透露。”他説。
亞馬遜的情感檢測野心在最近幾個月發表的兩篇論文中清晰可見。這兩篇論文都使用南加州大學(USC)的數據集來訓練模型,這些數據集是演員們大約12個小時的閲讀對話,總共10,000個句子組成的數據集被註釋以反映情感。
其中,情緒識別的多模態和多視角模型發現了亞馬遜 Alexa 高級應用科學經理 Chao Wang 所説的六大情緒:憤怒、厭惡、恐懼、快樂、悲傷和驚訝。
“情緒可以通過三個維度的數值直接描述: 效價,即情緒的積極性(或消極性) ,激活,即情緒的能量,然後是支配性,即情緒的控制性影響,”Chao Wang説。
這項工作的多模態方法分析來自音頻的聲音和詞彙信號來檢測情緒。亞馬遜高級應用科學家 Viktor Rozgic 解釋説,聲學研究語音和聲音的聲波特性,詞彙研究詞序。
“聲學特徵或多或少地描述了你説話的方式,詞彙特徵描述了內容,它們對於情感聯繫都很重要。因此,在提取特徵之後,它們被輸入一個模型中,這將是不同的神經網絡結構,然後我們最終做出預測。”他説。
亞馬遜最近分享的另一篇論文《Improving Emotion Classification through Variational Inference of Latent Variables》 ,解釋了一種在情緒預測效價方面取得輕微改進的方法。
為了從音頻記錄中提取情感,聲音記錄中的人類互動被映射到一系列的光譜向量,輸入遞歸神經網絡,然後用作分類器來預測憤怒、快樂、悲傷和中性狀態。
Rozgic 説:“我們將聲學特徵輸入編碼器,編碼器將這些特徵轉化為低維表示,解碼器從中重構原始音頻特徵,並預測情緒狀態。在這種情況下,它的效價分為三個層次——消極、中性和積極,對抗學習的作用是以一種特定的方式規範學習過程,使我們學習的表現更好。”
除了提供關於亞馬遜情緒檢測野心的細節,在 re: Mars 的一次會議上探討了情緒識別和情緒表示論的歷史,Chao Wang稱之為情緒識別研究的基礎,由南加州大學的信號分析和解釋實驗室和麻省理工學院的媒體實驗室等學校領導。機器學習、信號處理和支持向量機等分類器的進步也推動了這項工作。
這項技術的應用範圍很廣,從電子遊戲設計的反應測量,商業廣告等營銷材料,尋找路怒或疲勞駕駛的安全系統,甚至幫助學生使用計算機輔助學習。Chao Wang説,這項技術也可以用來幫助人們更好地理解他人的情緒。
雖然已經取得了一些進展,但是Chao Wang説情緒檢測仍然是一項正在進行的工作,“這個領域的數據和解釋存在很多模稜兩可的地方,這使得能夠實現高精度的機器學習算法變得非常具有挑戰性。”Chao Wang説。