阿里大模型元老楊紅霞去向官宣:入職香港高校!被曝創業項目也在推進_風聞
量子位-量子位官方账号-5小时前
明敏 發自 凹非寺
量子位 | 公眾號 QbitAI
最新消息,阿里大模型元老楊紅霞入職香港理工大學,任電子計算機系教授。

楊紅霞是AI領域知名科學家。她曾在IBM T.J.沃森研究中心擔任研究人員,並在雅虎擔任首席科學家。2016年加入阿里巴巴,就職於達摩院智能計算實驗室;2023年3月入職字節跳動。
她在達摩院期間領導了通義千問前身M6大模型的研發,是M6大模型從百億、千億參數量進化到萬億規模的主要功臣,並領導通義大模型核心技術“統一學習範式OFA-M6”的開發。
任職字節期間,她主要負責大模型研發,向字節AML和豆包大模型Foundation團隊負責人項亮彙報。
今年5月,楊紅霞被曝從字節跳動離職,有傳聞稱她將進行大模型領域創業。
如今,更先一步曝光了她進軍學術圈的消息。
此前楊紅霞未曾在高校內有正式任職,僅擔任過浙江大學上海高級研究院兼職教授。
通義千問奠基人物
楊紅霞本科畢業於南開大學統計學專業。博士就讀於杜克大學。
在頂級會議和期刊上發表論文100餘篇,在美國和中國擁有50多項專利。
主要研究方向為貝葉斯統計、時間序列分析、時空建模、生存分析、機器學習、數據挖掘及其在商業分析和大數據中的應用。

博士畢業後,她最先在IBM T.J.沃森研究中心擔任研究人員。之後來到雅虎擔任計算廣告首席數據科學家,負責開發廣告投放預測相關算法。
2016年,楊紅霞回國入職阿里巴巴,就職於達摩院智能計算實驗室。
在此期間她最重要的工作是推動了M6大模型的研發和擴展。
這一多模態模型是通義千問的前身,也是構建阿里當下大模型競爭力的關鍵基礎工作。

M6項目在啓動研發1年時間左右,快速完成從億級到十萬億級規模擴展。2020年6月項目啓動,2021年5月發佈萬億參數規模M6並投入使用,2021年10月M6正式成為全球首個10萬億參數多模態大模型。
不僅成為當時世界上最大的中文多模態模型,並且快速追趕上谷歌的發展腳步,在文生圖、商業化等領域達到世界一流水平。而且在綠色低碳方面,相比GPT-3,M6實現了同等參數規模下所需能耗僅為1%。
這項工作由阿里和清華共同開發,楊紅霞、唐傑共同擔任通訊作者。

其他主要成員,正是通義千問研發的核心成員,比如An Yang、Rui Men。
M6的共同一作林俊暘是目前通義千問開源負責人。

2022年9月,達摩院正式發佈“通義”大模型系列,打造業界首個AI通義底座,並構建了大小模型協同的層次化人工智能系統。
其中統一底座的M6-OFA模型由楊紅霞領導完成。
它在業界首次實現模態表示、任務表示、模型結構統一。不引入新增結構,單一模型就可以同時處理超過10項跨模態任務,升級後可以處理超過30種。
這項工作對外開源,目前被引用數超過900+,GitHub星標2.4k。

而就在這項重磅發佈1個月後,楊紅霞被曝因家庭原因從達摩院離職。
下一次新動向已是2023年3月。
消息稱她已加入字節AML(機器學習系統)團隊,任字節跳動大語言模型研發技術專家,在美國西雅圖從事大語言模型的研發。
不過短短1年時間,她就又從字節離職。與此同時,行業的風向也從基礎大模型開發,逐漸轉向更細分的應用落地方向。
同步籌備全球化AI項目
值得一提的是,此前楊紅霞的下一站被猜測是“端側模型創業”,佈局AI Agent。
5月消息稱,團隊正在籌備組建中,已獲得3000-4000萬美元投資,投後估值1.5億美元。
最近量子位從知情人士處獲悉,楊紅霞前不久還在西雅圖籌備全球化AI項目。
綜合來看,楊紅霞入職香港理工大學,可能和創業動作並不衝突。
值得一提的是,從事更具體的AI細分領域大展拳腳,確實是目前AI人才再創業比較集中的選擇。
比如漆遠的創業方向選擇了可信大模型。從螞蟻集團副總裁任上離職後,漆遠先是重返學界,在復旦擔任教職,而後又產學研並行地創立了大模型公司無限光年。
此前,量子位從市場獲悉更多消息如下:

如上或有缺漏與誤傳,歡迎評論區留言指正、分享更多行業信息。
參考鏈接:https://www.polyu.edu.hk/comp/people/academic-staff/prof-yang-hongxia/