孫劍:找到科研落地的解決辦法就像與世界對話

11月18日,有“中國諾貝爾獎”之譽的何梁何利基金2019年度頒獎大會在北京舉行,來自人工智能領先企業曠視的孫劍獲得“科學與技術創新獎”,成為AI產業界唯一獲獎者。
獲獎對他來説並不少見。10月末兩年一度的國際計算機視覺大會ICCV在韓國首爾落幕,期間舉行的COCO挑戰賽是全球最權威的國際計算機視覺競賽,孫劍及其團隊一舉拿下了物體檢測、全景分割、人體關鍵點3項第一——這是其連續第三年獲得多項冠軍,也是COCO自2015年開賽以來“前無古人”的紀錄。
“AI已經悄悄潛入日常生活,就拿這次在COCO挑戰賽獲得冠軍的三個項目來説,此刻或者將來你一定用得上。”孫劍在接受中國青年報·中國青年網記者獨家專訪時説,參賽拿冠軍並不是目的,重要的是用更強的、有差異化的產品來證明自己。
孫劍解釋,計算機視覺領域中講的“物體檢測技術”就是要訓練機器能夠檢測到圖像裏的特定內容,比如一張照片裏的人或動物以及它們大概在什麼位置,這項技術可以應用在自動駕駛領域,幫助汽車檢測路上的行人、車輛、紅綠燈狀況,也可以應用到智能物流,幫助機械臂準確地抓取物體;“全景分割技術”則到了像素級別,機器知道照片裏的人在哪兒還不夠,還需要知道具體形狀,人們在手機自拍的時候,這項技術就能把人的輪廓精確地分割出來,一鍵換照片背景;“人體關鍵點”與人密切相關,定義了頭、肩、腿、膝等20多個關鍵點,定下這些點,機器就能知道人在做什麼動作、是如何運動的,之前在網上流行的給一段視頻中的人瘦身,就應用了這項技術。
那麼,團隊的水平到什麼程度呢?以物體檢測為例,如果滿分是100,就意味着所有物體都被檢測出來了,沒有錯漏;在五六年前,計算機只能得10分,經過人工智能的深度學習,現在孫劍團隊的系統能得61分,“將來可能做到90分”。
從求學和科研道路看,孫劍是一個妥妥的“學霸”:1997年在西安交通大學自動控制專業獲得學士,2000年和2003年西安交通大學人工智能與機器人研究所獲得碩士和博士,畢業後加入微軟亞洲研究院,後任首席研究員;2015年至2016年,孫劍在微軟美國研究院任合夥人級研究主管。
2016年,他加入曠視,任曠視研究院院長,因為他覺得“創業公司最接近前線,能最快把技術應用到實踐”。
上大學時,老師講過“既要做鬼,也要做神”,“做神”指的是基礎問題研究,“做鬼”則是解決實際問題,這句話讓孫劍記憶深刻。在微軟亞洲研究院時,孫劍師從時任院長的沈向洋,他的做法是不強調“神鬼”的先後順序,出現實際問題就先解決“鬼”,解決問題之後再去研究“神”,往往會對實際問題產生更深的認識。
孫劍曾説:“‘先神後鬼’還是‘先鬼後神’是因人而異的,但一定要‘神鬼兼顧’,只有綜合經驗和理論,才能在科研路上越走越遠。”
在計算機視覺領域,有幾個方面是業界最關心的,因為與應用密切相關。孫劍説,除了物體檢測、全景分割、人體關鍵點,還有圖像分類,知道一張圖是人是貓、是室外還是室內在實際應用場景中非常重要。人臉解鎖的算法就以此為基礎,在使用智能手機拍照時,根據場景自動調整更好的拍攝效果也得益於此;再如三維感知避障導航,一輛小車在室內場景繞一圈,大概就能知道周圍的三維幾何結構是什麼樣子,這也是自動駕駛的關鍵技術之一。
從2014年開始,曠視研發人工智能算法平台Brain++,覆蓋從數據的生成、預處理、標註和存儲,到算法架構設計、實驗環節設計、訓練環境搭建,再到訓練、加速、調參、模型效果評估和產生模型,以及模型分發和部署應用的全流程。
這些高深的詞語也許一般人聽不懂,曠視聯合創始人兼CTO唐文斌有過一個簡單通俗的比喻:如果説曠視各種各樣的算法是“雞蛋”,那Brain++就是出產所有雞蛋的“母雞”。
“2015年,谷歌發佈了人工智能算法平台TensorFlow,我們比較了一下,覺得Brain++更方便、更有優勢,所以一直研發下去,直到今天,我們是唯一全員使用自主研發框架的公司。”孫劍説。
在微軟研究院,全球大概有50個計算機視覺研究員,而在曠視研究院,這個領域的研發人員接近500人。孫劍介紹,曠視研究院的研發人員以年輕人為主,“剛畢業或者畢業一兩年的”,“最初的核心人員,60%以上是清華大學的畢業生,其中很多是打過ACM(國際大學生程序設計競賽)的,融合了不同方向的人才,有的擅長做硬件,有的擅長做系統”。
“成長是剛畢業的年輕人最大的需求。創業公司提供了最快成長的環境:硬性的包括對新員工的系統培訓,讓年輕人能不斷做有挑戰性的事情;軟性的我們內部叫‘勇敢地成長’,鼓勵年輕人用成長性思維破除一些習慣性思維,敢想敢做。”孫劍説。
據瞭解,何梁何利基金創立於1994年,錢學森獲得當年的“科學與技術成就獎”,2006年起增設“科學與技術創新獎”。
對科學堅持不懈的探索並將其轉化為實際應用,孫劍在這條道路上走得很踏實,也很快樂:“很多年了,激發我做研發的一個最大動力,就是我們會解決很多難題。當突然找到一個很有效的解決方法,那個時刻,讓我感覺自己在與世界對話。可能第二天那份激動就過去了,但我們會一次又一次追尋這樣的時刻。”