谷歌人工智能公益計劃:座頭鯨説,我是歌手_風聞
谭婧在充电-谭婧在充电官方账号-偏爱人工智能(数据、算法、算力、场景)。-2019-07-27 19:04
科技進步帶動着人類保護野生動物能力的提升。在我國,紅外相機技術也在自然保護區應用,尤其是對那些分佈範圍狹窄、密度低、數量稀少的保護物種比較有效,特別適用於記錄活動較為隱秘的大中型或夜行性的珍稀獸類和鳥類。比如央視《秘境之眼》電視節目就記錄了這場不被打擾的相逢。
野生動物保護不是一時一地的行動,而在全球範圍內持續行動。儘管數十年來有公益機構致力於捕鯨保護,但仍有 15種鯨魚陸續被列入 “瀕危物種法”。即使是座頭鯨這一成功恢復的物種,也沒有進入安全期,同樣會也會受到諸如漁具纏繞和船隻碰撞等威脅的影響,這些都是導致鯨魚非自然死亡的主要原因之一。
美國漁業是世界上最大和最具可持續性的漁業之一,有賴於美國政府對此不遺餘力的支持。這次,谷歌與美國國家海洋和大氣管理局(NOAA)的太平洋羣島漁業科學中心合作。
為了更好地保護這些動物,第一步是瞭解它們的位置和出現的時間,以便能夠減輕它們面臨的風險,比如向船隻發出警告。大多數鯨魚和海豚待水面上的時間很少,因此通過視覺技術查找和計算它們的位置非常困難。
鯨魚和海豚在水下度過大部分時間,並將聲音作為主要的交流方式。這使得聲學監測成為研究它們的理想方式。所以,太平洋羣島漁業科學中心依賴於使用水下錄音機進行收聽。也就是,在海底安裝了一個全球範圍內的監聽設備網絡,追蹤鯨魚的活動。聆聽海洋是科學家監測難以研究的動物(如鯨魚)的重要方式。
聽,鯨魚在“唱歌”。
然而,難點在於,設備錄下了鯨魚的歌聲的同時,也會錄下大量的噪聲。美國國家海洋和大氣管理局(NOAA)的太平洋羣島漁業科學中心一直使用高頻聲學記錄包(HARP)在太平洋的12個不同地點錄製水下音頻,其中一些早在2005年就已開始。他們累積了超過170000小時的水下錄音。這麼龐大的錄音,即使工作人員全天24小時的傾聽,也需要19年的時間來聽完這些音頻資料,手工標記座頭鯨的叫聲也是非常耗時的。這時,人類需要人工智能從大量的噪聲數據中尋找特定的模式,AI更擅長這類重複繁重的工作。
被動聲學監測是用水下麥克風收聽海洋哺乳動物的過程,可用於記錄信號,以便離線完成檢測,分類和定位任務。與船基視覺調查相比,優勢包括檢測能力,更長的檢測範圍和更長的監測週期。
谷歌人工智能接受了這項公益挑戰,出手與美國國家海洋和大氣管理局(NOAA)的太平洋羣島漁業科學中心合作開發了一個深度神經網絡,可以自動識別這些非常長時間的水下記錄。挑選了座頭鯨這個鯨魚物種。谷歌欲將最新的機器學習技術應用於世界上最大的社會和環境挑戰原因是,在過去幾年中,Google AI Perception團隊開發了音頻事件分析技術,這些技術已應用於YouTube上的非語音字幕,視頻分類和索引。此外,谷歌發佈了AudioSet評估集並開源了一些模型代碼,以進一步推動研究。谷歌想知道是否有可能將這些相同的技術應用於該數據以協助野生動物監測和保護。
項目面臨不少困難。因為,水下采集條件可能會有所不同:例如,下雨或船噪聲的存在可能會混淆機器學習模型。錄音機和鯨魚之間的距離會導致聲音非常地微弱。最後,座頭鯨的呼叫特別難以分類,因為它們不像長鬚鯨的叫聲那樣具有鮮明穩定的特色。相反,座頭鯨更喜歡“唱”複雜的歌曲,更喜歡隨時間變化改變自己的發聲。
如果座頭鯨有一句獨白,那一定是,我是歌手。
項目利用谷歌現有的大規模聲音分類技術開展工作。首先將水下音頻數據轉換為聲譜的視覺表示,稱為譜圖,然後給算法譜圖,這些譜圖用正確的物種名稱標記。標註的數據喂的越多,算法就越能自動識別這些聲音。
谷歌使用ResNet-50網絡,這是一種通常用於圖像分類的卷積神經網絡架構,已經在分類非語音音頻方面取得了成功。這是一種有監督學習,其中只有手動標記的數據可用於訓練。谷歌數據分析結果能夠看到座頭鯨明顯的季節性變化與人類目前已知的模式一致,其中座頭鯨種羣夏季在阿拉斯加附近吃喝玩樂,然後遷移到夏威夷羣島附近繁殖和分娩。
在未來,會長期瞭解識別育種地點或遷徙路徑的變化來,幫助人類更好地瞭解座頭鯨,瞭解這位深海歌手。(完)
親愛的數據
出品:譚婧
美編:黃楠