專訪商湯科技聯合創始人林達華丨一名人智能人才,需要多少栽培?_風聞
谭婧在充电-谭婧在充电官方账号-偏爱人工智能(数据、算法、算力、场景)。-2020-03-30 14:37
原創:譚婧
林達華,現任MMLab掌門。MMLab是香港中文大學多媒體實驗室,也是港中文-商湯聯合實驗室。掌門的大部分時間花在全球多個實驗室裏,所以北京的記者想面對面採訪,未必是件容易的事。
最終,我們約見在人工智能(AI)界武林門派相聚的大場面——世界人工智能大會。
“全球智能領域最具影響力的科學家和企業家相聚於此地”的俗話,就不必提了。
拜見武林一流門派掌門人,腦中會有“作拱手抱拳狀”的想法。誰知,他幾句中英文混搭的表達,馬上把我拉回到AI的世界。林達華説話間始終帶着一種professor(教授)上課時特有的細膩與耐心,彷彿既可求教,亦可與其爭論。
修煉上乘武功,需入名門,拜名師。在學術界,地勢高是一種相對優勢,雖然不是絕對優勢,但是,研究者所處的平台往往能起到決定性的作用。在很多懷抱着AI成才夢的學生眼裏,MMLab是名門,林達華是名師。
今日的老師,亦是昨日的學生。
時間拉回到2012年,林達華獲得美國麻省理工學院計算機科學博士學位。“當初為什麼不留在美國?”他應該不是第一次被問到這個問題,而且,他也已經做出了自己的選擇。
他笑了笑,給出了一些細節原因。
他説:“中國內地和香港都有很好的環境,加入MMLab可以迅速地投入到研究工作中。香港中文大學和湯曉鷗老師都給了很多支持。”
可見當年,他選擇研究平台的時候,沒有太多猶豫。
“在麻省理工求學最大的收穫是什麼?”
他的回答是,接觸到不一樣的科學文化,學習到不同的研究思維。
他又強調:“研究創新講求的是思維碰撞,我格外看重。”
這是一個需要被格外重視的要點,也是練功的不二法門。
他告訴我,碰撞,從而得到很多創新成果。這不僅是他的體驗,也是湯曉鷗老師的理念。既然重要,他就進一步解釋了“碰撞”。
他説:“湯教授也曾講過,新思想有賴於碰撞與交流。碰撞出來的想法對實驗室做創新很重要,使研究者站在世界前沿。”
回憶起在香港中文大學的研究生時光,他談道:“早期的人臉識別還沒有用到深度學習技術。我在麻省理工之後的學習,更偏統計學習與概率建模。回到香港中文大學任教時,正好身處深度學習的浪潮中,做的是深度學習。”
一個週期,往往是一個研究人員的半輩子,機會留給有準備的人。
林達華有一個很高的起點,而他繼續在這個高起點上積累,盡全力把學術研究和學生們推上一個新高度。
五年彈指一揮間,從2015年到2019年,MMLab累計拿下99篇CVPR,38篇ECCV,51篇ICCV,9篇NIPS。
如今的MMLab不再是一個武林門派,而屬於一派武林聯盟。
2019年是一個里程碑。
這一年,商湯科技及他們與多所全球知名學府共建的聯合實驗室,總共以57篇論文入選ICCV。算上同年CVPR被接收的62篇論文,累計有119篇論文入選全球兩大計算機視覺頂會。
人們常説,一切科研成績的背後,都是刻苦的鑽研、紮實的訓練。其實還有更重要的後半句,這是更值得探索的關鍵——“什麼是有效的訓練?”
有了《九陽真經》,也得講究如何以正確的法門練功,走火入魔了怎麼辦?
“做research(研究)最重要的是什麼?”
林達華説:找到真正的挑戰在哪裏。
邁入MMLab,林達華希望學生,特別是剛進入學術研究領域的學生能夠深刻理解的第一個問題是:做research(研究)最重要的是什麼?
“答案並不複雜。”林達華説。
“做研究最重要的是,找到真正的挑戰在哪裏。很多研究人員在實驗室裏面拍拍腦袋,做一篇論文。雖然這個論文可能很成功,但是沒有什麼應用的價值。因為學術界想象的問題和產業落地需要解決的問題,它們之間有很大的gap(鴻溝)。”
他停頓一下,強調:“研究人員在AI落地的過程中接觸到了真實的需求,從而發現學術界根本沒有注意到的事情。”
“MMLab的學生,不發非頂會論文,不發沒有突破的論文。”
這句話代表着林達華對學生的期望與要求。他不想讓學生在學術的路上有“另一種”學術思維和習慣。
在他的世界裏,優秀與非優秀不是兩個不同的標準,而是在做兩件截然不同的事情。
論文對學者的學術高度有決定性意義。但是,從林達華對學生的栽培,從他對學術教育的理解來看,他的汗水不會浪費在——僅僅寫出“漂亮”的論文。
他要的是高質量的創新,這是MMLab文化中更深層次的動機。
一心只想打敗別人的,會成為武林高手。一心思考創立武功門派的,會成為武林宗師。
只要稍微打聽一下,就能得知,今日的香港中文大學MMLab絕不缺生源,很多基礎紮實、成績優秀的學生慕名而來。
林達華這樣描述剛剛邁進實驗室的學生,“很多學生第一年來MMLab,有一定的知識儲備,但是對如何做研究還處於起步階段。”在他眼中,每個學生的可塑性都非常強。
他直言:“MMLab對學生的期望是,畢業之後獨立開創一個方向,帶一個團隊。” 比如他看到,有不少他的學生畢業去了商湯就能直接lead(帶)團隊。
“進了實驗室之後,學生會接受什麼樣的訓練與培養?”
也許是第一次被問到這個問題,採訪時,林達華靜靜地思索了一會,拿出了一個“三階段理論”,讓我不得不迅速進入“記錄練功要訣”的狀態。
他強調,MMLab沒有獨門培養秘籍,恰恰相反,這是一個AI領域的研究者必然經歷的三個階段,也是人才培養的規律。
第一個階段,懂得怎麼做一個project(項目),突出一個“領”字。
他會告訴學生,要做一個什麼項目,往哪個方向探索,技術路線是什麼。學生會在他指導之下,在師兄的協助之下,逐步自主完成一定數量的項目。
在一開始的時候,他會與學生一起仔細地討論“教授的指引與期望”。林達華強調,在這個過程中,絕對不會強迫學生去做不願意做的事情。他在説“絕對不會”這四個字的時候,特意加了重音。
因為,學生要做的事情,雖然是緊跟教授指引,但是學生必須提出自己的想法,明確自己感興趣的地方。
他再根據學生的想法,圍繞這個問題在學術上是不是真的有價值,朝這個方向做下去會不會遇到一些根本性的障礙等問題來來回回溝通。
這個過程可能會用一個月的或者更長時間。他認為,過程本身就創造了教學的意義。
他強調:“目的是教授領着學生找到一個長期深入做下去的學術方向。”一開始,他可能會給學生較多的指導,觀察學生,瞭解學生一步一步學習適應的情況。學生在這個階段會在有指導的情況下,逐步開展研究。
此時,林達華第二次強調,MMLab的學生不會發沒有突破的論文。因為目標定的低,是浪費學生時間。
他認為,思維方式和研究習慣的養成異常重要。如果從一開始就定位發非頂會論文,會養成“另外一種”思維方式,這種思維方式,不在實驗室培養體系之內。這是從學生需要的視角再次去解讀為什麼不發非頂會論文。
第二個階段,突出一個“獨”字。
林達華説,他會和學生一起定一個方向,但不會有細緻入微的guidance(指引)。學生恐怕需要自己找資源,大多數嘗試甚至連數據集都沒有。
在林達華眼中,MMLab在很多比賽中名列前茅,那只是對學生的鍛鍊。
他自信而又坦誠地説:“我們已經完全超越了‘刷榜時代’,鍛鍊學生用AI解決問題的能力,在我給他們制定的第一階段的長跑中就已經完成了。”
第二階段的重點任務是開拓一個方向。
“我們會討論這個方向的目標是什麼。可能連數據集都沒有,那就得自己建,把算法做出來,設計實驗,堅持到完成。這個時候,學生需要養成獨立完成一個高水平的項目的能力。”
林達華在描述“科研探索者”一種拾階而上的人生之路。多少練武之人一步一個石階的攀爬到“壁立萬仞”之下,抬頭一望,四字凜然。
他繼續介紹,第三個階段,也是畢業前的一個關隘,突出一個“闖”字。學生自己找到研究方向,獨立產生研究思路,堅持到底。
他再次強調了一下重點:“自己找挑戰,自己找問題。”
“踏踏實實地經歷以上三個階段,基本意味着畢業後可以獨擋一面。”這是林教授的教誨,也是他心之所願。
“學生個人的情況會有所不同,有的偏思考型,有的偏實踐型,有的偏工程型,我希望每個學生畢業後都會形成一條獨具個人特色的研究路徑。”
他又補充道。
“獨具特色”一詞被林達華格外看重。從某種程度上講,這個詞裏包含一種“高質量創新”基因。他言語中透露出那種對學生與生俱來的特色的珍視。
“無論學生是偏好研究還是偏好工程,都會找到自己的位置。有的學生畢業後願意去商湯科技,因為今天的商湯科技已經是一個計算機視覺領域的大平台。有的學生願意去美國繼續深造。”
林達華樂意看到種子發芽,拔節成長,至於選擇未來奮鬥的土地是熱帶雨林,還是高原盆地,他不會給限制。
他的任務是把學生培養出來,並帶有MMLab的基因。
從培養一個個,到培養一批批。
湯曉鷗教授於2001年創辦了MMLab,十幾年過去了,它早已孕育出別具一格的研究文化。“我們如何理解MMLab的團隊文化呢?” 林達華答道,“我們當然有自己的文化。”但是,思考了一會。
他説:“這也是我第一次總結實驗室的文化”。
第一、尊重。
尊重學生的創新想法。這裏強調的不是分配研究想法,我們的角色是導師(adviser),這個角色的重點是引導學生形成研究的想法。
教授並不會在一線接觸數據和代碼,如果隨便地指手畫腳很可能會干擾學生的創新思維。
學生需要自己找到真正有價值的挑戰。當學生形成想法,他會拋給學生第一個問題——為什麼這個問題之前沒有解決?
休想讓他直接告訴學生,你該做還是不該做。
這個問題可能做完文獻綜述之後,也未必思考得清楚。文獻綜述只是回答這個問題的其中一個環節。
為了解釋這個關鍵問題,他馬上舉了一個例子,像極了課堂上老師回答學生的追問。
“以時序算法為例,學生可能會説,以前的方法受制於十秒內存的限制,處理幾分鐘或者更長時間視頻分析遭遇到困難,我要研究的問題和前人研究的有何不同之類的介紹。”
林達華説,這個問題不能讓學生僵化地回答,他會要學生儘量具體地回答,研究的問題和論文A有哪些不一樣,和論文B有哪些不一樣。”
第二,價值。
假設這個研究已經做出來,價值在哪裏?
他強調不侷限於學術價值,而是給人類社會帶來的價值。
“還是以時序分段網絡為例,解決這個問題,就意味着拓展了AI處理視頻時長的能力,以前處理不了的視頻,現在可以通過技術手段處理了。”
他借用具體的研究來解釋思考問題的方式。
“如果要在學術上有所行動,首先要回答清楚這兩個問題。如果這兩個問題能夠處理好的話,需要研究的問題實際上就已經成立了。”
他強調,一個學術問題,不需要一堆問題來定義,一到兩個根本性問題就能夠將這個問題定義清楚。Adviser(導師)這一角色重點是在引導學生創造有價值的想法。
教與學,答與問,日日修煉,夜夜參悟。
討論中的林達華 攝影:譚婧
MMLab與AI獨角獸商湯科技如何合作?
“在回答問題前,我必須説,MMLab作為研究機構,與商業機構比較起來,有着完全不同的使命。使命決定了目的地。”他先強調了這一句,才開始回答我的問題。
這代表着,他對自己所領導的研究機構的使命理解得非常清晰,是一個既熟于思考,又想得透徹的問題。
林達華説:“商湯能與很多不同的行業、對AI有不同需求的夥伴接觸,積累大量落地經驗。這些經驗對學術研究者非常寶貴。
MMLab會和商湯研究院,日常非常密切地交流。面對實際問題,商湯研究院先上,而面對更基礎性的問題,研究院會‘交棒’給實驗室。”
“交棒”的背後是充分的信任。
一個動作,兩層內涵。
交棒的人完成了自己的任務,抵達了自己的終點。接棒的人接受的不僅是工作,更是信任。
“拍拍肩膀,哥們兒,以後靠你了。”
接棒人,上場了。
背上是責任,也是期望。
“基礎性問題以研究課題式項目管理的形式來推進。實驗室不能保證研究過程中能夠100%把問題解決掉。”
他表達的時候,神情理性且堅定,又輕輕地搖了搖頭,強調了“研究的宿命”:“因為做研究沒有100%的保證。沒有。”
“但是。”他的臉上露出了笑容,接着説道:“實驗室在研究這個問題的過程中,會提出很多非常有價值的思路。不僅如此,這些思路,研究團隊會做出實驗,做原型出來。”
接着,他又直接地表達了商湯和MMLab的關係,面容上,沒有任何意欲婉轉的意思。
“商湯是一家商業機構,要考慮營收,可能有些問題不能拖個一年半載。
這時候,實驗室的優勢就會有所發揮,因為實驗室有很大的空間去做這件事,會發展出更加長期、更加創新的解決思路。商湯與MMLab有交流機制,保證‘發現問題,解決問題的閉環’不斷地循環。
實驗室創新的思路會在最短距離變成產品,而市場也會給與實驗室最直接的反饋。”
在林達華看來,產學研的呼聲喊了很多年,但是,很多機構間的合作鏈條並不順暢,而商湯和MMLab的合作自然而又緊密。
研究資金,是一個頗有些引人注意的問題。
林達華清楚地介紹了研究資金的兩大來源,他説道:“一方面,香港中文大學給實驗室很大支持,教授們無需憂心費用,可以非常專心做研究。
另一方面,商湯科技和香港中文大學有研究投入協議。此外,大灣區AI相關產業發展迅速,政策支持。對實驗室來説,費用上壓力小,視野更高更廣,更專注長期、專注創造性,更有能力把工業界的問題解決徹底。”
順勢,他舉了兩個例子:
第一,如何處理比標籤數據大百倍、千倍的數據?
計算機視覺研究會涉及到海量數據,其中很多沒有打標籤,而傳統的深度網絡是有監督學習的。
那麼,如何處理比標籤數據大百倍、千倍的數據?
這個問題被交到了MMLab。
眾所周知,模型質量和性能與輸入數據有很大關係。如果沒有有效的聚類方法,送數據進去反而會使模型質量下降。需要一個有效的,過上億級別的數據進行聚類的方法。
MMLab最近有2-3篇論文都是關於這個方面。一種有效的做法是把大規模的數據聚類,之後的每一類看成其中一個不同的人。但是如何在海量數據中高效高質量地聚類是尚未解決的開放問題。
這個問題不是對具體某個產品提升,而是研究團隊抽象出解決方法,去解決一個根本性的問題。
好消息是,使用了神經網絡進行聚類,對商湯科技所有需要用到海量數據的產品帶來了性能上提升,很多業務線都用到了這個解決辦法。
第二個,視頻理解工作。
在2013和2014年之前,大部分視頻理解的工作都是處理10秒以內的短視頻,用機器分類短視頻的辦法距離實用還非常遙遠。即使卷積神經網絡提出之後,因為硬件的限制,還是沒有辦法處理長視頻。
MMLab傳統分析一段視頻,每隔五幀取一幀。GPU放不了太多幀。但是,工業界的實際情況是需要處理相對長時間的幾分鐘的視頻。在這種背景下,MMLab在2016年,提出時序分段卷積網絡。
“時序分段這個方法不再是五幀、五幀去取。實驗室將整個視頻按照語義,每隔五幀分成若干個段落。這樣解決了兩個問題。每隔五幀取,重複性高,重複計算量大。如果間隔較遠才取一幀,時間尺度又會變長。
團隊決定向着較遠的取幀時長努力,因為重點是避免重複的計算。
解決問題的思路並不複雜,但是從根本上和大家的思考方向不同。別人都在想着怎麼改善網絡結構,但我們改變了採樣的方法。
這個方法讓實驗室取得了當年ActivityNet比賽的冠軍。同樣也是好消息,從2016年起,這個論文提出的方法就已用在商湯的各種視頻分析的業務線產品中。”
林達華想用這兩個例子來對比高校實驗室和企業研究院的區別。高校實驗室基礎研究空間大,基礎性研究一旦成功,槓桿效益巨大。
他對實驗室有能力把工業界的問題解決得更徹底,非常有信心。
校企合作激勵AI學者向本質問題挑戰,而這些本質問題恰恰不是一個純學術實驗室環境能遇到的。
本質問題非常頑皮,常常生於工業界。所以,很難下一個單一的結論,是學術界帶動了工業界,還是工業界帶動了學術界。
按照林達華的觀點,“正反饋的閉環”是最佳解讀。
一名畢業於北京大學的碩士研究生同學告訴我:“申請博士的時候MMLab一定會在首選實驗室清單中,現在MMLab享譽全球,實力堪比常春藤名校,連大神級人物何凱明也待過,令人嚮往。”
學與教,問與答,日日修煉,夜夜參悟。
“創新者”與“創造者”林達華,在對科研的熱情中棲居,在對教學的深情中寄植,他探索着科研的生命力,張揚着沙場上的將領精神,只等凱旋。
(完)
林達華簡介:
林達華是香港中文大學信息工程系助理教授,他在計算機視覺、概率推斷,與深度學習方面有廣泛的研究經歷,並在多個課題上取得突出成績。他在CVPR/ICCV/ECCV/NIPS/PAMI等計算機視覺與機器學習頂級會議與期刊發表逾百篇論文。他在2010年獲得機器學習領域最權威國際會議NIPS的最佳學生論文獎,並在2009年與2011年獲得計算機視覺最高學術會議ICCV的傑出評審員獎。他曾指導香港中文大學的研究團隊參加ImageNet、ActivityNet、以及COCO等計算機視覺領域的主要國際競賽,獲得多個冠軍。此外,他也擔任CVPR,ECCV,AAAI,ACM Multimedia等主要國際會議的領域主席,以及頂級國際期刊IJCV的編委。
林達華教授2012年獲得美國麻省理工學院計算機科學博士學位,2007年獲得香港中文大學資訊工程碩士學位,2004年獲得中國科學技術大學電子工程與資訊科學學士學位。
