跨年齡人臉識別技術,能夠讓拐賣兒童犯罪現象消失嗎?_風聞
造就-造就官方账号-发现创造力2019-06-21 10:41
在過去,由於從兒童到成人時期臉部變化太大,人臉識別困難度大,許多拐賣兒童案最終都陷入僵局。
今天,隨着人工智能技術的發展和應用,一個古老的犯罪類型——拐賣兒童,正在被技術逐漸瓦解。
賈佳亞
香港中文大學終身教授
騰訊優圖實驗室傑出科學家
現在的圖像識別、人臉識別技術****精細到什麼程度?
當我們用肉眼去看一張照片時,尤其是在海關或者安檢等需要比對人臉的場景下,人腦的識別能力其實是蠻有限的。
人的臉型在發育成長過程中會發生巨大變化,就算是人的大腦,這個方面的訓練數據也是不夠的。我們涉足這個領域屬於無心插柳之舉——當技術已經到了一定地步之後,我們想看看能不能做跨年齡的人臉識別,是從純技術的角度出發來做的。
但是現在,我們發現它很有用,因為它在中國有一個特殊的應用,叫作尋找被拐兒童。
比如説十幾年前丟失的一個小孩,很多年後,當你通過我們的官方或者政府尋找到這樣的一個人之後,我們還是要確認到底是不是這個人,除了DNA之外最簡單直觀的方法就是通過人臉去比對。
從全球範圍看,做這個技術的人並不多,雖然我們的技術目前還不是很成熟,但已經可以用來解決一部分問題了。
在尋找失蹤兒童公益項目裏,我們今年有六七個尋回案例,與家人失散的時間有的超過了七年,有的甚至長達十幾年,所以這還是蠻有震撼力的。
跨年齡的人臉識別技術是靠什麼實現的?
絕大多數算法都是叫數據驅動,有多少數據就有多少智能。也就是説,如果你的數據不夠,你的算法的成功程度就不會很高。我們創建人臉識別的時候也是依賴這樣一個算法。
無論是人或者算法機器,當他們去直觀地看一張人臉圖時,都不知道哪些地方是他成長以後會變的,眼角、鼻子、臉型等等都有可能。
尤其是臉型,從兒童到成年,這之間的變化可能會非常之大。在這一點上就是要追蹤它的變化過程,不能用人去追蹤,靠人手去標定的話,是不可能找到其中最關鍵的特徵的,所以我們還是依賴了一些基本的算法。
我們收集數據都是靠自己的員工,靠他們貢獻小時候照片來作為訓練算法的數據集(是完全保密狀態,他們才願意拿出這些數據)。
然後通過這些數據再去分析:到底絕大部分人的臉部會發生什麼變化?臉是變長還是變瘦?眼角是變寬還是變窄了?
在這些變化中間,我們要尋找一種普適性,而普適性的尋找過程肯定也要依賴數據的提供。所以在這個過程中,算法還是挺有用的。
怎麼看待人臉識別帶來的數據安全隱患?
説實話安全隱患一定會是個問題。
從我對社會發展的瞭解和對數據監管的角度出發,或者説從科學的角度出發,我覺得像舊金山把人臉應用完全禁止的做法有點極端了。
人臉是一種非常簡單的人體識別信息。相比於我們自己平時提供給各大機構、政府、商家的身份識別信息,人臉的信息量其實非常少。
信息量最多的是什麼呢?是身份證。上面既有你的樣子,也有你的年齡住址,你的身份證號碼。這個才是最大的身份驗證,也是最容易泄露的信息源。
我們也看到,社會上最不安全的信息載體不是人臉,反而是以實物卡片形式存在的身份證,它也是最容易被泄露的。不管是銀行還是商家,如果監管稍微有一點漏洞,你就會發現自己的身份證信息被出賣了。
無論從大的社會層面還是從技術層面看,相比起歸管我們的物理信息以及名字、ID這些後來被社會賦予的虛擬信息,歸管人臉和生物信息都更加容易。
當前人臉識別技術最亟待攻破技術難點是什麼?
現在整個技術的拓展,不是因為某一種物理現象或者是物理條件的約束,導致它不能夠做得很好;**絕大部分情況下,一個技術要不斷地往上走,依賴於我們有沒有一種能更好地模擬或去擬合物理世界的模型,**比如我們能不能發展出像人腦一樣的人工智能?
我們人腦識別一個人臉,可能只要千分之一秒甚至萬分之一秒的時間。而且,不管它的清晰度、大小、角度如何,我們都能夠知道這是不是我認識的人。
識別人臉在大腦裏的功耗是極小的,但是在機器上做人臉識別,它的功耗至少是人腦的幾十上百倍甚至上千倍,而且準確度、識別效果都有很大的提升空間。從這一點來説,技術進步是不會有止境的。
當然我們也可以通過算法去做一些人腦認知能力可能做不到的事情,比如暗光下的人臉識別、物體識別、景物識別等等,這也是一個好的研究範疇。
我們團隊不久前就發表了一篇在極暗光下情況下把圖像增強到肉眼可以看清的研究成果。
如何確保科技的應用範疇都是積極正面的?
我覺得這是一個叫科技倫理學的概念。以前是沒有這個概念的。現在漸漸有政府、公司、社會學者提出這樣一個倫理學的概念。有意思的事,我也參與建立了很多關注這個話題的委員會。
我的看法是,每一項技術的產生們都包括了正負面,**科技永遠是個中性的東西,**它就像一個人的性別一樣,你要把它分成男女,再讓它有不同的功能之後,才有性別之分。
技術是中性的,如何讓它偏向於合理的或者是好的應用,把那些不好的應用給摒棄掉,是我們應該去研究的。整個人類社會需要對它的使用範疇進行規範,就像原子能的應用,你不能用它製造具有殺傷性的武器,你不能用它毀滅人類。
《切爾諾貝利》劇照
我們在發展科技的過程中是一定需要倫理的。
當然,人工智能的倫理還沒有生物學倫理那麼嚴肅和重要。在生物學倫理上,比如任何的基因改造不能用於人,甚至説不能用於哺乳動物,這些倫理規則是非常嚴肅的,人工智能現在還沒有到這個地步。
人工智能目前還達不到自主產生想法的程度,它還需要非常漫長的時間來發展。但是在應用層面,如何防止濫用人臉信息,防止數據或者算法被用在壞的場景裏,防止不法分子利用技術生成虛假人臉在線上盜取銀行信息等,肯定都需要法律法規來進行規範,這些在倫理學上也提出了非常大的挑戰。
優圖實驗室未來發展的方向有哪些?
第一個在醫療方向。從各個層面來説醫療板塊關係到我們的健康與生存質量,所以我們希望儘快地切入到這個領域,幫助三四線城市、小鄉鎮等缺乏醫療資源的地區,讓更多的普通人能夠享受到醫療資源。
醫療產業很大,全世界的醫療支出量級高達幾十萬億以上,所以在整個醫療領域,我們還是有很大的發展機會。
另一個重大場景就是自動駕駛,對騰訊而言,其產業價值,以及對於改善生活便利程度的想象空間,都是非常大的。
除此之外,我們還會切入到線下AR+零售,以及傳統的工業生產領域。
現在有很多高危行業依然在使用傳統人力,比如到橋樑、鋼絲上去檢查缺陷等。這些工種其實都應該逐漸被機器取代,把人類從這些高危工作中解脱出來。這些場景都是我們要重點去發展的。