梅林:人臉識別,我們該怎樣理性看待它?
【採訪整理/ 觀察者網專欄作者 鐵流】
10月29日,西安警方利用人臉識別系統在盜竊案發10分鐘後迅速抓獲犯罪嫌疑人。其實,公安機關利用人臉識別系統抓獲犯罪嫌疑人的案例還有不少,今年9月,崑山警方利用人臉識別系統抓獲了一名潛逃8年的犯罪嫌疑人。在2015年,公安機關還利用人臉識別系統將一名自1997年就攜9000萬鉅款潛逃國外,並洗白身份後歸國的犯罪嫌疑人抓獲。
根據官方公佈的消息,目前“人臉識別技術”已經用於反恐活動中,該技術為動態識別,每秒鐘能夠識別5個人的身份。在今年於北京舉行的中國國際安博會上,人臉識別、“人證合一”的產品大放異彩!那麼,人臉識別技術究竟發展到哪個水平了,真正被廣泛使用還需要破解哪些技術難題,對哪些行業的發展起到促進作用呢?觀察者網專訪公安部第三研究所物聯網技術研發中心梅林主任,為大家答疑解惑。

**觀察者網:**人臉識別今年被炒得火熱,從馬雲的刷臉支付到人臉的預警,好像疑犯追蹤裏提到的人臉識別很快就要實用了?是這樣嗎?
梅林**:**大片裏我們經常可以看到類似《疑犯追蹤》中的動態人臉識別,它指的是人在運動過程中人臉被攝像機捕獲,再跟黑名單布控庫裏的人臉進行比對,實時輸出預警信息。坦率地講,這樣的應用,可能還需要一段時間的技術發展,但已不再是遙不可及的了,屬於可以看到曙光的應用。
動態人臉識別,主要需要解決兩個問題:1)、開放場景下動態人臉高精度檢測;2)、開放場景下動態人臉實時識別。由於是開放場景,人臉不會去跟攝像頭主動配合,造成角度、分辨率、光線等多方面的變化較大,使得黑名單人臉庫的比對準確率大幅下降。
目前我們注意到已經有廠商在從人臉採集源頭來想解決辦法,比如公安部第三研究所在今年北京安博會上推出的槍球聯動動態人臉識別系統以及格靈深瞳的人眼攝像機都在做這方面的嘗試。

**觀察者網:**現在很多應用需要採集我們的人臉或其它生物特徵,那怎樣保障我們的隱私不被泄露?
梅林**:**我們注意到手機、筆記本等用指紋開鎖,雖然方便,但是安全是有問題的,首先,我所的公安部信息網絡安全重點實驗室僅用假體攻擊就能輕易打開這些指紋鎖,其次,很難保證指紋信息沒有被聯網的手機、筆記本傳出去。指紋、虹膜、DNA等生物特徵是重要的個人身份信息,因為生物特徵是每個人所獨有的、伴隨終生的、不可更改的。一旦大規模泄露,造成的後果將是災難性的!為了使個人生物特徵信息不被非法獲取和泄露,要多管齊下,一是個人要加強自我保護意識;二是國家要在標準制定方面、在生物特徵採集設備市場準入和強制檢測方面,保證終端的安全;三是要加強數據的保護手段以及數據的安全應用。
對於網絡空間的身份認證,目前最安全的是通過“公安部公民網絡身份識別系統”,採用eID來進行網絡身份認證;生物特徵識別應當作為物理空間身份查驗中“人證合一”的輔助手段,即判別持證人是否持本人的身份證。

**觀察者網:**人臉識別、虹膜識別等生物特徵識別是否可用於網絡遠程的身份認證?“刷臉支付”到底安不安全?
梅林**:**網絡空間一定存在被黑客攻擊的風險,今年德國紐倫堡大學發表了一篇face2face的論文,從技術上已經實現了遠程用模擬他人人臉進行身份認證。即使拋開黑客攻擊,生物特徵識技術在理論上有別於密碼技術,是不可能做到100%準確的,所以,在開放的網絡空間,銀行開户和大額支付等高安全級別場景,不宜採用生物特徵識別技術進行認證,否則將引發系統性風險。在採集設備可控、環境可控的安防場景,人臉識別等技術應用前景很廣泛。總之,任何技術都有其適用場景,不能因為方便而不顧安全隱患、特別是系統性風險。

**觀察者網:**政府即將推行“一號一窗一網”的互聯網+政務服務,尤其是“一網”,將來老百姓辦事通過網絡不用出門了,是不是用人臉識別就可以享受各種服務了?
梅林**:** “一號一窗一網”的互聯網+政務服務解決“一網”問題的最好最安全可靠的方案就是eID,eID完全可以解決網絡身份認證的難題。對於人臉識別等生物特徵識別技術,前面已經説了,是不安全、不可靠、有系統性風險的,因此不宜在“一網通辦”採用。

**觀察者網:**人臉識別要真正用起來未來還需要破解哪些技術難題?
梅林**:**目前,深度學習帶來了人臉識別技術大的突破。但是,只能説該技術的引入使得人臉識別技術前進了一大步,真正能用得好還有不少距離。這主要有這幾個方面的原因:
一是用於深度學習的訓練庫目前數量還比較少,光線、角度的變化範圍等還比較有限,僅僅是全球人臉變化空間的很小很小一部分,其分佈不足以表達所有人臉的各種變化,而用這樣的人臉庫訓練出的模型其遇到新的人臉的識別能力就會降低;
二是視頻中的人臉識別不同於靜態圖片的人臉識別,要設計適合於視頻的深度學習模型;
三是工程上實用的人臉識別勢必要進行必要的場景設計,通過構建標準化人臉採集的場景,使得採集到的人臉達到高識別率的成像質量,同時還要設計一定容量的黑名單庫,使得使用效果更佳。所以,通過構建更大規模的人臉訓練數據集、設計適合於視頻的深度神經網絡模型以及進行必要的工程設計是影響到動態人臉識別效果的幾個關鍵。
**觀察者網:**據説,人能記住的人臉數是有個上限的,機器對於能識別的人臉的數量有限制嗎?
梅林**:**這點來説,確實是機器超過人的地方,目前機器對上百萬級乃至上億的人臉庫進行比對都有可能,只不過隨着人臉庫容量的增加,首位命中率可能會降低,一般會採用前5命中率或前10命中率。
**觀察者網:**請您預測下未來的人臉識別會有什麼樣的實際應用?
梅林**:**我們應該理性看待目前人臉識別的全行業應用熱潮,迴歸到人臉識別應用最適宜、最具創新意義的應用場景。人臉識別未來的實際應用,我想可能在以下幾個方面取得發展:
1)、與視頻監控相結合的主動布控技術,將廣泛的用於機場、高鐵、地鐵等場景,支撐安保智能化的進一步發展;
2)、“人證合一”核驗,用於在重點場所進行現場人臉和證件中人臉的同一性認定;
3)、影視動漫行業。基於真人表情驅動的動漫角色的擬人化,將極大地促進全CG(Computer Graphics)動漫影視作品的發展;
4)、和心理學結合的微表情分析,可以更精準地刻畫個人的內心世界,用於審訊、心理諮詢與疏導等;
5)、年齡、民族、國籍的識別;
6)、可用於各類視覺機器人。

**觀察者網:**最近一些省份賓館等重要場所都安裝了“人證合一”核驗設備,這主要起到什麼作用?
梅林**:**隨着人臉識別技術的發展,由採集到的身份證裏面的照片和現場照片進行1:1比對以確定是否為本人的“人證合一”核驗設備已日漸成熟並進行了推廣應用。因此,該技術在酒店入住場景的應用,一方面,賓館可以為老百姓提供便捷的自助登記,同時可以減輕賓館前台壓力;另一方面,可以為加強各地公安出台的賓館酒店實名登記制度的有效落實,原來靠前台人員比對住客本人是否與所持身份證為同一人,現在可以逐漸全自動化了。
**觀察者網:**我們正處在人工智能產業革命的時代,人工智能在公共安全中應用也是產業的一個熱點,能否描述下這個方向未來會為我們平安中國建設帶來哪些期待?
梅林**:**以深度學習為代表的類腦智能可以説在各行各業都帶來了令人震撼的應用。比如,在機器翻譯領域,基本可以替代非專業級的翻譯員,在語音識別領域,也已經幾度刷新最新的結果。
同樣,深度學習在圖像目標檢測、分類、檢索等方面的進展,將極大地推動計算機視覺在安防領域的深度應用,為平安中國建設提供全新驅動引擎並助力視頻大數據的廣度、深度應用。當前,我們的智能視頻監控還只是單點的智能應用,未來,隨着在線自主學習的突破,通過構造一個生態系統,實現可發育、可自生長的智能視頻監控系統,那就是類人智能視頻分析系統了。
**觀察者網:**這個案例反映出身份證辦證環節的漏洞,類似這樣的身份漂白的人羣有沒有更好的監測預警辦法?
梅林**:**這個問題由我的同事,公安部第三研究所eID事業部嚴則明書記回答更貼切。
嚴則明**:**10月6日,公安部黨委副書記、副部長黃明在調研落實今年7月15日由公安部等八部門聯合發佈的《關於規範居民身份證使用管理的公告》(以下簡稱“公告”)情況時指出,公安部已建成失效居民身份證信息系統並於近日上線試運行,將在銀行試點後提供社會各用證部門,與現有的公民身份信息系統進行聯網核查。這意味着在加強規範居民身份證使用和核查、增強居民身份證使用嚴肅性的同時,公安部在不斷地完善居民身份證體系的嚴密和安全。

居民身份證是由《中華人民共和國居民身份證法》、《中華人民共和國治安管理處罰法》等法律法規賦予法律地位。原來社會上對居民身份證的不規範使用、甚至濫用,起不到身份查驗的真正作用,反而使得身份冒用、甚至身份信息泄露事件頻繁發生。掛失失效的二代證信息系統聯網充分發揮了信息系統的聯網的優勢,依託全國三十九個居民身份證制證中心的制證信息,對社會提供居民身份證最新有效期的聯網查驗,通過系統顯示的最新制證時間與被查驗居民身份證的連線比對,可以準確識別已經掛失的居民身份證,此舉為線下身份查驗提供了有效的輔助手段。
公告還強調,登記指紋信息的居民身份證可以有效防止被他人冒用。我國居民辦理身份證需登記指紋的規定是在2012年1月1日正式實施的新居民身份證法中提出的,並於在全國範圍內全面啓動辦理居民身份證時採集指紋信息,未來隨着加載指紋特徵信息的第二代居民身份證及相應讀卡機具的普及,將為履行公告中指出的“嚴格落實人、證一致性核查責任”提供自動化基礎環境支撐。
可以看出,國家為打擊身份證買賣和堵住掛失身份證濫用的漏洞已經做了大量工作。
**觀察者網:**現在市場上做人臉識別的企業特別多,都號稱很強大,有時可能沒宣傳那麼好,會浪費很多納税人的錢,作為行業的研究所,你們有沒有更好的幫助用户進行鑑別的辦法?
梅林**:**我們注意到這種情況,這反映了人臉識別技術評測體系的不健全、不科學,導致各家自説自話。作為行業研究所和公共安全科技領域的國家隊,為社會提供可信可靠的公共安全保障技術,是我們的使命所在,責任重大。有鑑於目前各人臉識別設備廠家在實驗室人像數據庫上積極“刷分”自彰,公安部第三研究所目前正在建設智能視頻評測服務中心,包括建立公共安全典型場景監控數據集,建設覆蓋安防行業典型應用的實景人像庫和視頻事件庫,並正在評估籌建安防圖像測評體系,從助力公安部行業監管的角度,為人臉識別市場的正規化、有序化提供科學可信的評測機制。今年9月份,依託中國計算機學會計算機視覺專委會和圖像視頻大數據產業技術創新聯盟,成功舉辦了首屆面向公安應用的視頻圖像分析技術挑戰賽,進一步引起了業界的關注。
**觀察者網:**我注意到公安部第三研究所在國內最早提出視頻結構化描述,當時你們有個很好的比喻,就是電影是從劇本到視頻的過程,而結構化描述是從視頻到劇本的過程。很形象直觀地描述了你們所做的複雜的工作。現在經常有采用根據目擊證人描述進行人臉畫像的方式去偵破案件,將來人工智能發達了,能否實現由機器人去自動畫像?這是不是又從文字到圖像了?
梅林**:**視頻結構化描述是2009年胡傳平所長在分析了視頻監控建設聯網應用現狀後,大膽地提出的,現在看來當時的定義仍然具有前瞻性:視頻結構化描述是對視頻內容按照語義關係,採用時空分割、特徵提取、對象識別等處理手段,組織成可供計算機和人理解的文本信息的技術。它除了我們平常説的語義標籤之外,更強調了基於領域知識圖譜的視頻對象語義關係,這是機器可理解的基礎。從視頻到文本是結構化描述的過程,那麼怎麼從描述人臉的特徵,比如柳葉眉、丹鳳眼去畫像呢?這其實就是從文本再到圖像的過程,應該説這又到了另一個高級階段,目前專業人臉畫像師確實是依據自己的豐富經驗,結合目擊證人描述時的心理狀態等進行的創作過程,而讓計算機去綜合利用這些信息確實還是有一定難度,但相信隨着技術的進步,機器人去畫像的那一天可能會到來。
最後,非常感謝觀察者網的專訪。該訪談僅代表本人觀點,不當之處,歡迎專家批評指正!

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。