湯曉鷗:我入睡前聽於謙,機器怎麼可能超過這樣有趣的靈魂?
None
7月6日,2023世界人工智能大會在上海開幕,香港中文大學教授湯曉鷗介紹了他和他的團隊在原始創新領域的最新進展。
湯曉鷗首先回顧了過去十年他的三個學生王曉剛、何愷明、林達華在各自崗位上對深度學習的原創貢獻。

香港中文大學教授湯曉鷗,圖源:新民晚報
湯曉鷗介紹的第一個學生是王曉剛。王曉剛本科是中國科大少年班,並且是00班的第一名,碩士期間在湯曉鷗實驗室就讀,在MIT博士畢業後回到湯曉鷗在香港中文大學的實驗室做教授。2011至13年CVPR和ICG兩個視覺領域最重要的會議上,全球共有29篇文章做深度學習,其中有14篇出自湯曉鷗的實驗室,全世界其他的實驗室做了15篇。
王曉剛的第二項工作是首次讓機器做的人臉識別超過了人的眼睛,比Facebook還早。2015年,王曉剛帶隊取得了中國學者第一個ImogeNet世界冠軍,當年的對手是谷歌。
湯曉鷗介紹的第二個學生是何愷明。2009年,何愷明在湯曉鷗實驗室讀碩士期間就發了第一篇文章,取得了CVPR最佳論文,這是CVPR25年歷史上從亞洲出來的第一篇最佳論文。湯曉鷗曾跟何愷明開玩笑:“你一出手就到了巔峯,從此以後你的學術生涯就只能往下走了”,結果他去微軟和Facebook工作以後仍然一路走高。
何愷明的第一項工作是在MSR做的,獲得了2016年的最佳論文。在2015年之前,深度學習最多隻能訓練到20多層,何愷明在網絡的每一層引入了一個直聯通道,從而解決了深度網絡梯度傳遞的問題。
何愷明的第二項工作Mask R-CNN獲得了ICCV2017年最佳論文。湯曉鷗表示,何愷明是世界上唯一一個在畢業不到十年內,三次以第一作者的身份獲得CVPR、ICCV最佳論文。
第三個學生林達華的第一項工作是OpenMMLab,在2018年從一個小團隊開始,在沒有推廣投入的情況下,以口口相傳的形式成為國際上最具影響力的視覺算法開源體系,目前用户遍及全球140多個國家和地區。
湯曉鷗還介紹林達華的另兩項工作成果,即將正式發佈的國內首個千億參數、8K的多語種大語言模型“書生·浦語”以及全球首個城市級實景三維大模型LandMark。
湯曉鷗對三位學生的成就評價道:“王曉剛在深度學習興起的最初幾年,灑下了很多原創的種子。何愷明將深度學習的根基打得非常牢、打得很深。林達華通過開發和大模型讓他枝繁葉茂。”
湯曉鷗表示:“讓我非常欣慰的是,這顆大樹已經開始開花結果。就在兩週前,我們的自動駕駛大模型從9155篇文章中脱穎而出,獲得了CVPR2023年的最佳論文獎。”
根據谷歌學術統計,這是改革開放40多年來第一篇全部由中國學者完成的國際計算機視覺三大頂會的最佳論文,文章的牽頭作者是王曉剛帶出來的博士。此外,OpenMMLab是林達華帶出來的博士陳愷做出來的,當年湯曉鷗實驗室做的另一篇超過人眼的人臉識別的文章的作者陸超超,也從劍橋大學博士畢業回到了上海,正在和中國唯一的圖靈獎獲得者姚期智先生在上海期智研究院合作,從事AI基礎理論研究。
“新一代的學生已經在上海成功起步。”他感嘆。
湯曉鷗接着説:“作為一個在上海工作的東北人,我想再一次感謝上海,説一聲‘上海,你好’,我想對王曉剛、何愷明、林達華、陳愷、陸超超,以及所有我曾經合作過的學生、老師們,還有今天上海在座的朋友們,講一句:‘我不是在最好的時光遇見了你們,而是遇見了你們才有了這段最好的時光。’”
這句話是于謙老師的電影《老師好》中的一句經典台詞。“這句話非常優美,富有詩意,也發自我的內心,”湯曉鷗説,“每天晚上睡覺前,我都是一邊聽着于謙老師的相聲,一邊想:‘機器怎麼可能超過這樣有趣的靈魂?我不信。’”