當瀕危野生動物開始被昇騰AI保護起來_風聞
曾响铃-2022-05-22 10:53
作者 | 曾響鈴
文 | 響鈴説
大量的野外拍攝照片需要專家人工識別並進行註釋,費時費力;
決策者可以很快決定該如何採取行動,但在這之前要花很長時間等待數據分析結果;
幫助行業專家和公益界人士更好地優化保護方式的科學研究,常常因為野外圖像數據支撐還不夠導致進展緩慢……
動物保護已經成為人類共識,但在行動上卻因為數據處理和挖掘速度根不上而面臨種種尷尬。隨着渡渡鳥、大海雀、塔斯馬尼亞虎、西部黑犀牛等珍惜動物的滅絕,生態系統所面臨的潛在不利影響正在放大,強化動物保護的科研認知、加快實踐落地工作變得更加緊迫。
在這樣的大背景下,人工智能介入動物保護就變得順理成章,這些年從國內到國外大量的公益組織與科技企業都在嘗試用AI推動與動物保護有關的圖像數據處理工作。
然而,對AI模型開發而言,瀕危野生動物保護與其他多數領域相比面臨十分複雜的挑戰,高效的AI開發框架和專業的技術團隊支撐變得更加重要,在業內,已有相關的合作在開展,例如某自然保護機構就與來自昇騰AI產業生態的昇思MindSpore開源社區合作,共同將AI 應用於生物多樣性保護場景。
這種合作,將推動照片識別流程的速度,節省人力和時間,並將野外相機抓拍到的珍貴動物數據更快地反饋到科研和保護工作當中,而其過程,也是克服動物保護領域的獨特挑戰。
數據端被“扎口”,AI動物保護在模型端承受更大壓力
經過數年積澱,立足自主AI計算架構的昇騰AI產業生態已經度過原始的積累期,在生態夥伴、行業場景等方面不斷突破,推動着千行百業的智能化升級。現在,昇騰以昇思MindSpore開源社區進入公益領域並不令人意外。
而無論與誰合作、服務於誰,昇騰AI產業要“搞定”一個場景往往需要針對性的合作模式與技術創新——在與上述自然保護機構的合作中,AI參與動物保護就面臨獨特的訓練數據挑戰。
從官方公佈的信息看,雙方首期投入作為訓練集的數據主要來自上述自然保護機構與其他合作機構從2011開始所積累的野外紅外相機數據,一共12680 張照片,其中12180 張作為訓練集,500 張作為驗證集。
這些照片來支撐一個AI模型的開發,面臨兩個問題:
一是數據總量“不上不下”,上萬張照片用人工去分析、挖掘數據耗時費力,但對AI來説又似乎並不充裕,尤其是照片還分為了雪豹、岩羊、白唇鹿等常見的 10 個物種或物種類別,進一步“稀釋”了數據的垂直度,而照片數據的獲取與增長本身還受限於採集條件;
二是數據質量不佳,部署於野外的紅外相機所獲取的圖像往往難以清晰、完整,模糊的身影、與周邊環境難以區分等問題常常出現。
這就形成了一個尷尬的邏輯鏈條:一個動物越瀕危,其保護就越重要,AI越是應當參與進來,但是,能夠獲取到的圖像數量和質量往往也越差,又給AI帶來了更大的挑戰,即“越重要就越困難”。
於是,一個AI模型開發所主要關注的兩個環節——數據和算法,隨着數據端被“扎口”,壓力就更大程度上來到了算法開發上。而且,由於很多圖片本身即便是人工識別也有一定難度。
這又對AI模型的能力提出了其他領域少見的“超越人眼而不是追平人眼”的要求。一邊是數據受限,另一邊是對效果有高期許,動物保護領域的AI模型開發“兩頭承壓”,也就對開發框架提出了更高的支撐要求。
成為國內首個參與動物保護的AI開發框架,MindSpore的探索不僅限於技術
昇騰與自然保護機構的合作,讓昇思MindSpore成為國內首個參與動物保護的AI開發框架,而為了應對上述挑戰,可以認為,此次合作中昇騰除了技術本身,還在合作模式上做了探索。
首先,是既然“數據採集”(原始數據獲取)受限,那麼就不斷提升對數據的“珍視度”,在“數據標註”(用標註框框出照片中的識別對象的位置)階段發力。
一般而言,用於AI模型訓練的數據往往都是通過“勞動密集”的標註工作來輸出,目前較少有前沿技術和專業人士的參與。而此次合作,昇思MindSpore 團隊線上指導了自然保護機構團隊使用AI標註平台開展物種標註工作,並後續邀請了 61 位志願者來一同進行數據標註——準確標註的數據再去“餵養”AI模型,將直接提升模型訓練的效果。
然後,是通過權衡取捨確定最佳的算法路徑,不迷信於單一類別的基礎模型,而是根據實際情況結合AI開放框架的創新綜合考慮。
針對經典的one-stage模型精度低但速度快,而two-stage模型精度高但速度慢的現實,昇思MindSpore 開源運營團隊和自然保護機構討論後採用了YOLOv3 目標檢測模型,其歸屬於one-stage但同時得益於昇思MindSpore的創新開發能夠平衡檢測的質量和速度,能在效率的基礎上保證識別的效果。
再有,是以開源推進的方式讓公益領域的AI也能羣策羣力。
本次合作的所有代碼、模型文件和部署文檔均已在昇思MindSpore社區開源,大量的開發者參與其中,為模型的優化做出貢獻,更好地應對動物保護領域的獨特挑戰。而模型被開源後也不單服務於上述自然保護機構一家機構,還能夠幫助到更多需要的人和機構,發揮出更大的價值。羣策羣力、羣體價值共享的開源社區基礎願景在公益領域得到踐行。
最後,是公益組織與科技平台進行了“初創式”的合作模式探索。
在直觀上,是自然保護機構與昇思MindSpore探索了一套從需求出發的緊密協作機制,可以往其他公益機構、領域進行復制。
而內裏,是開源模式在公益領域的有效落地。在環保已經成為普遍共識的今天,通過技術的手段來強化公益工作已經是許多公益組織的必選項,公益組織與商業組織一樣在積極擁抱AI,擁抱能夠加深AI技術廣度與深度的開源打法。華為當然十分有意願加入到公益事業當中,發揮自身技術和業務沉澱的價值,而更應該強調的是,它作為昇思MindSpore 開源社區的一員,也是通過開源社區在貢獻自己的力量,努力推進優質識別模型的發展。
開源時代,AI社區“社會意義”的一面正在不斷強化
從自然保護機構與昇思MindSpore開源社區的合作不難看出,作為一種推動“技術進步”的模式存在,開源的打法不負眾望,幫助了AI識別模型的不斷優化並分享給了更多人。
而從另一個角度看,通過開源的方式,很多希望為公益出一份力的開發者有了新的抵達路徑,在捐錢、捐物、抵制珍惜動植物消費等做法之外,能夠將技術的力量通過社區貢獻注入到公益工作當中去,也許未來某一次的雪豹保護工作中所採用過的AI識別應用就有自己所貢獻的技術的痕跡,這是不可否認且能夠長期發揮價值的公益舉動。
自2020 年 3 月正式開源以來,兩年時間過去,昇思MindSpore社區已擁有 80 萬社區開發者,下載量超過 166 萬,5000+企業應用上線,認證開發者/佈道師近300人,社區貢獻者4500+,成為了國內第一熱度的 AI 開源社區。參與公益合作,讓快速發展的昇思MindSpore展示了AI社區在推動“技術進步”之外更能推動“社會進步”的意義,社區越是繁榮,能夠吸引到參與公益的開發者就越是廣泛,公益事業也就有了更好的技術支撐和保障。
而昇思MindSpore開源社區與上述自然保護機構聯合成立的AI for Biodiversity Conservation Working Group(簡稱:WG-AI4BC)就是基於此目的,以常態化合作機制匯聚更多的社會力量,強化人工智能技術研究,幫助尋找、保護中華水塔中的珍惜野生動植物。
就在520當天,華為官方公眾號還發布了關注昇騰AI(喻為“愛”)幫助世界更美好的推文(見文末鏈接),其中首先提到了利用昇騰AI保護雪豹,可見AI參與動物保護正在以凸顯人文關懷的方式來獲得更廣泛的關注和參與——本文的撰寫就一定程度上受到了這種人文關懷的推動。
現在,WG-AI4BC還在邀請更多開發者參與,在查閲立項文檔後,開發者可以選擇通過在社區提交ISSUE或者PR的方式參與到開源貢獻當中來,或者直接通過 [email protected]提交提案。
回過頭來看,昇思MindSpore開源社區所匯聚的行業、科研及開源力量,已經推動了醫療、交通、金融、互聯網、製造、能源、運營商等8大行業的智能化變革,幫助昇騰AI與產業的融合深度不斷加深,千行百業的產業智能化升級既有了高效可靠的底層AI基礎設施,也有了全面業務助力的AI使能者。
隨着昇思MindSpore開源社區開始往公益領域深入,昇騰AI產業生態將增添又一個重要的垂直領域,AI在公益領域的落地表現將更值得期待。
*本文圖片均來源於網絡
*此內容為【響鈴説】原創,未經授權,任何人不得以任何方式使用,包括轉載、摘編、複製或建立鏡像。
【完】
曾響鈴
1鈦媒體、品途、人人都是產品經理等多家創投、科技網站年度十大作者;
2 虎嘯獎評委;
3 作家:【移動互聯網+ 新常態下的商業機會】等暢銷書作者;
4 《中國經營報》《商界》《商界評論》《銷售與市場》等近十家報刊、雜誌特約評論員;
5 鈦媒體、36kr、虎嗅、界面、澎湃新聞等近80家專欄作者;
6 “腦藝人”(腦力手藝人)概念提出者,現演變為“自媒體”,成為一個行業;
7 騰訊全媒派榮譽導師、多家科技智能公司傳播顧問。