中國人首獲國際統計大獎
guancha
2025世界統計大會於北京時間10月9日晚10—11點在荷蘭海牙舉行,明尼蘇達大學統計學院教授鄒暉和斯坦福大學教授Trevor Hastie(特里瓦·哈斯蒂)共同獲頒2025年統計學奠基人獎。鄒暉也成為首位獲得統計奠基人獎的中國人。
統計學奠基人獎是國際統計學會(ISI)的最高獎之一,旨在表彰對統計理論、方法、實踐或應用產生深遠影響的研究成果。獲獎論文或著作必須是近三十年內發表的研究論文或書籍。評選委員會由來自世界各地的知名統計學家組成。
據瞭解,統計學奠基人獎每兩年評選一次。在2021年之前,該獎以統計學創始人之一卡爾皮爾遜的名字命名。首屆卡爾皮爾遜獎於2013年在香港召開的世界統計大會上頒發。2021,國際統計學會(ISI)決定重新命名該獎項,以紀念統計學的眾多奠基者。
鄒暉此次獲獎的主要原因,是其於2005年和Hastie教授在英國皇家統計學會會刊上刊發文章 《通過彈性網絡進行正則化和變量選擇》,該文被引23000餘次。這也是英國皇家統計學會會刊創刊以來引用最多的五篇論文之一。
自2000年以來,隨着生物科技、通信技術以及互聯網的突破性發展,研究者能夠採集大量的研究對象的信息指標。統計學上將這些指標稱為“變量”。當變量的數量非常龐大時,得到的數據被稱為“高維數據”。
面對高維數據,許多傳統的統計方法,包括經典的迴歸分析方法,不僅難以建立具有良好預測能力的模型,更無法解決高維數據中至關重要的可解釋性問題。舉例來説,研究者希望利用個體的上萬個基因表達信息,預測其是否患有某種疾病。一個理想的模型不僅要具有較高的預測準確率,還應能識別出哪些基因與疾病的發生直接相關。
此外,高維數據統計建模面臨的一大挑戰是計算效率。因為模型參數通常通過優化預測性能來估計,而高維數據優化問題往往非常耗時。
2002年,作為博士生,鄒暉師從Trevor Hastie,敏感地關注到了高維數據遇到的困擾。當時套索法似乎是最好的方法。套索法是現代統計裏的一個重要的發明,這項成果也在2021年獲得統計奠基人獎。但Trevor Hastie發現,面對高維數據,套索法預測效果不佳,而且選擇的變量很不穩定,但當時也沒有找到好的解決方案,於是將這個任務佈置給了鄒暉。經過探索,鄒暉找到了套索法的問題癥結,並給出了相應的解決方案。Hastie第一時間肯定了鄒暉的方案,同時構思了方法的名字——彈性網。
鄒暉介紹,彈性網同時兼顧三個目標:良好的預測性能、有效的變量篩選以及較低的計算複雜度,提供了一個高效的高維度數據迴歸建模的解決方案。使用者可以快速地得到一個預測精度高且解釋性好的統計模型用於各種複雜數據建模分析。目前該方法已被廣泛應用於高維數據分析。
鄒暉本科畢業於中國科學技術大學少年班,博士畢業於斯坦福大學統計系。
(科技日報記者 陳瑜)