阿里頂級大牛辭職創業,字節招兵買馬,AI大模型賽道風起雲湧
贺喜格

隨着ChatGPT的爆火,國內人工智能領域也風起雲湧,互聯網科技公司展開了AI大模型的軍備競賽,個人創業者也紛紛入局。AI人才隨之開始了新一輪的流動,消息稱原阿里AI大將楊紅霞加入字節,著名AI科學家、阿里副總裁賈揚清則選擇離職創業。
此外,阿里達摩院昨日低調上線一款“文本生成視頻大模型”,阿里在AI領域的佈局正在逐漸揭開面紗。
3月22日,據36氪報道,阿里M6大模型的前帶頭人楊紅霞已加入字節跳動AI Lab(人工智能實驗室),參與語言生成大模型的研發,並在語言生成大模型團隊中處於領導地位,直接向字節跳動副總裁楊震原彙報。
觀察者網就上述消息向字節跳動方面求證,截至發稿前暫未收到回覆。
ChatGPT沒有開源,意味着市面上暫時找不到可以輕鬆平替的大模型算法,各家想要在不依賴OpenAI和微軟的情況下開發相關產品,除了依靠自身的技術能力外沒有捷徑。比如不久前百度推出的“文心一言”的“基座”,便是百度自身的文心大模型ERNIE。
除已經推出文心一言的百度外,騰訊、阿里、京東、小米、網易等等大大小小的公司都宣稱將在該領域有所動作。此前,亦有字節AI Lab要開展類ChatGPT和AIGC的相關研發,未來或為PICO提供技術支持的消息傳出,不過字節跳動並未對此做出回應。彼時,PICO相關人士對觀察者網否認了這一説法。
不過,字節AI Lab此前便有機器學習、自然語言等相關研究,也有媒體報道,其正在大模型方面佈局、在語言與圖像模態方面發力。再結合技術大牛楊紅霞加入的消息,看起來字節跳動也並未放棄大模型的研發。
楊紅霞發表頂級會議、期刊文章超過100篇,美國和中國專利超過30項,2022年9月初,楊紅霞因個人家庭原因從阿里巴巴達摩院離職。

楊紅霞 圖/阿里雲開發者社區
超大規模多模態預訓練模型 M6 (MultiModality-to-MultiModality Multitask Mega-transformer)是楊紅霞在阿里期間的突出成就。
2021年3月,達摩院發佈了國內首個千億參數多模態大模型M6,引發業界關注。OpenAI前政策主管傑克·克拉克(Jack Clark)曾公開點評道:“這個模型的規模和設計都非常驚人。這看起來像是眾多中國的 AI 研究組織逐漸發展壯大的一種表現。”
2021年11月,阿里M6宣佈升級至萬億參數,並在全球範圍內首次大幅降低了萬億參數超大模型訓練能耗,更加符合業界對低碳、高效訓練AI大模型的需求。
據悉,通過一系列突破性的技術創新,達摩院團隊僅使用480卡V100 32G GPU,即訓練出了規模達人類神經元10倍的萬億參數多模態大模型M6,與英偉達、谷歌等海外公司實現萬億參數規模相比,能耗降低超八成、效率提升約11倍。
針對此次升級,楊紅霞曾表示,“接下來,M6團隊將繼續把低碳AI做到極致,推進應用進一步落地,並探索對通用大模型的理論研究。”
有志在人工智能領域有所作為的企業招兵買馬之際,另有一批人也一頭扎進了這股創業浪潮之中。
前京東集團副總裁、京東集團技術委員會主席周伯文,以及美團聯合創始人王慧文和創新工場董事長李開復、原搜狗CEO王小川等人紛紛投身人工智能相關的創新項目。如今,又一位技術大牛也要自己創業了。阿里巴巴集團副總裁賈揚清宣佈告別阿里,自己將於近期離職,“計劃走向職業生涯的下一個挑戰”。據悉,他的創業方向將聚焦於人工智能架構領域。
昨日(3月21日),賈揚清在朋友圈發文正式宣佈將離開阿里的消息:
阿里這段旅程,最吸引我的是雲計算給社會帶來的獨特貢獻:Al,Big data, Compute,Developer,and Ecosystem。有幸能夠帶領計算平台事業部,一起建設大數據和AI的平台,建設從技術到產品到解決方案的團隊,把大數據和AI業務做到行業領先的位置,為雲上的客户創造價值。
白駒過隙,我也計劃走向職業生涯的下一個挑戰。祝願團隊的兄弟姐妹們再創輝煌,祝願阿里雲能夠越走越好。
昨天,我和團隊宣佈了畢業的消息。3月20號是冬天的最後一天,借用加繆的一句話:每個冬天的句號都是春暖花開。祝福大家一切都好,春暖花開!

賈揚清被稱為AI架構領域最強的華人科學家。
賈揚清本科和研究生階段就讀於清華大學自動化專業,後赴加州大學伯克利分校攻讀計算機科學博士。他在博士期間就創造了AI領域的世界級成果,開發並開源深度學習框架Caffe,被稱為“Caffe之父”。在TensorFlow出現之前,這個框架一直是深度學習領域GitHub star 最多的項目。
後來主流的兩大機器學習框架的開發也都有賈揚清的身影。在谷歌大腦(Google Brain)工作期間,賈揚清是TensorFlow的主要開發者之一。後加入Facebook(META)任Facebook AI架構總監,2018年,Facebook正式公佈PyTorch 1.0,賈揚清擔任PyTorch 1.0項目的共同負責人。這些研究為後來的AlphaGo提供了底層支撐。
2019年3月,賈揚清加盟阿里擔任副總裁,引起業界關注和期待。
觀察者網瞭解到,賈揚清領導阿里雲智能計算平台事業部,負責大數據以及AI方向的技術、產品和業務。據悉,他團隊規模在幾百人級別,在杭州、北京和硅谷等地打造阿里的自研大數據和AI平台,並與阿里雲銷售團隊緊密合作。他還參與阿里巴巴達摩院AI和系統方向的技術建設,為阿里巴巴集團各業務線提供AI技術支持。
賈揚清當時的一大任務是將大數據和人工智能兩大平台打通,對此賈揚清曾説:“這樣的融合很具有前瞻性,阿里是全球少數的幾個把大數據和人工智能放在一起的部門。未來大數據和人工智能未來的結合將越來越緊密。”
賈揚清發文中並未明確提到自己的下一步動向,只説“計劃走向職業生涯的下一個挑戰”。不過有媒體報道,與賈揚清相關的一家新的AI公司正在醖釀當中,瞄準AI架構領域方向,並且已經順利得到了首輪融資意向。
人工智能技術正加速向通用人工智能前進,ChatGPT的火爆象徵着AI正迎來又一個階段性爆發。
3月21日,阿里達摩院已在AI模型社區“魔搭”ModelScope上線了“文本生成視頻大模型”。根據介紹,整體模型參數約17億,目前只支持英文輸入。
今年2月,阿里發佈財報後的電話會議上,阿里巴巴集團董事會主席兼CEO、阿里雲新一任總裁張勇便談到,目前雲計算和人工智能的結合正處於技術突破和發展的關鍵時期,生成式AI正在發生顛覆性突破,阿里巴巴將全力構建好自己的AI預訓練大模型,併為市場上的模型和應用提供好算力的支撐。
隨着近年來的發展,人工智能逐漸褪去了身上的神秘感,距離普羅大眾越來越近,真正能潛心發展的大公司與人才的湧入,勢必又會加速這一進程。繼2016年AlphaGo擊敗圍棋世界冠軍李世石後,人工智能領域再一次風起雲湧。
本文系觀察者網獨家稿件,未經授權,不得轉載。