“考古”周靖人,主導LLM、推動MaaS、AI開源,下一步如何與雲整合?_風聞
BImpact-宇婷,To B行业观察者、资深媒体人、博主。-04-06 19:37

撰文 / 宇婷
堅持獨立的思考,不侷限於此刻。
2023年4月11日,阿里雲北京峯會即將召開。在百度、360相繼公佈了自身的大模型產品以及進展後,這一次峯會被受眾高度關注,聚焦在:阿里是否會正式公佈其大模型的進展,以及將與阿里雲如何整合?
對比微軟和微軟雲Azure,大模型會對雲業務本身會產生巨大的拉動。首先,微軟向OpenAI投資100億美元,獲得OpenAI 75%的直接利潤份額。其次,所有OpenAI的技術都運行在Microsoft的Azure雲基礎架構上,形成雲資源的調用。最後,微軟還將OpenAI的人工智能整合到Word、PowerPoint、Outlook和其他應用程序中,推動包括Teams、Loop等產品的用户量提升。
儘管中國廠商追趕ChatGPT3.5可能還要以1年為單位,但國內百度、阿里、字節、騰訊、360等大型公司,有着充足的區域市場。大廠競爭大模型,也在競爭AI生態。
文心一言目前已經有了先發優勢。
對於阿里來説,根據業內消息,其特質是在AI算力的儲備上充足,包括A100顯卡資源目前在國內廠商中儲備位列行業第一,以及寒武紀芯片等有所供應。此前阿里雲也發佈了自己的結構路線。
阿里巴巴在LLM(大型語言模型Large language mode)領域的研究主要由達摩院負責,目前由阿里雲智能CTO、達摩院副院長周靖人主導。在2022年阿里巴巴層發佈了相關自然語言大模型技術M6和plug。
阿里巴巴大模型研發成功會對天貓、淘寶、高德、釘釘等業務應用直接帶來直接的商業價值。此外,直接通過阿里雲向TO B客户提供,也會構建新的MaaS商業模式。
在兩週前的阿里雲北京數據庫峯會上,周靖人曾有過一個簡短的演講,我查看了下週靖人過往在AI領域表達的觀點,看得出周靖人對於MaaS的思考前置於這一波ChatGPT熱浪,並且展現出了技術和應用的平衡。
1、成為阿里雲CTO前,領導阿里大數據智能研究
在2022年12月29日阿里巴巴董事會主席兼CEO張勇發出全員郵件中,宣佈了周靖人(靖人)將擔任阿里雲智能CTO,並同時繼續兼任達摩院副院長。
根據搜狗百科,周靖人2004年獲得美國哥倫比亞大學計算機博士學位,後加入微軟擔任研發合夥人。微軟期間帶領團隊研發了支撐着微軟必應搜索,Office 和 Windows 等高性能大數據計算平台。
他的主要研究方向包括大規模分佈式系統和數據庫、異構數據庫,擁有16項相關專利,在國際多家權威期刊發表50多篇論文。
周靖人還是1994級中科大畢業生。
2016年,周靖人正式官宣加入阿里巴巴集團,負責達摩院智能計算實驗室等工作。任職阿里雲首席科學家,帶領阿里雲中美兩地研發團隊。總體負責阿里雲大數據平台和人工智能研究iDST(Institute of Data Science Technology)的科研工作,涉及大規模機器學習和語音、自然語言、圖像以及視頻處理技術。
他是大規模分佈式系統和數據庫等領域的國際級權威學者,曾入選IEEE Fellow。(百科了下IEEE Fellow,即IEEE會士,是IEEE最高級別成員,也是IEEE授予成員的最高榮譽,在學術科技界被認定為權威的榮譽和重要的職業成就;當選人需要對工程科學與技術的進步或應用做出重大貢獻,為社會帶來重大價值。)
2017年,他做了《阿里雲大數據分析與智能》主題演講。
根據媒體新智元對當時演講的報道,當時他演講觀點:
“各大公司的計算架構都很類似,但是阿里雲的特色在於架構間各種資源是共享的,並且,由於是自建系統(home built system),系統在調度和部署時也會便利很多。”
當時他還提到了一個比較有趣的挑戰——算法是不斷變化的。如果針對某個問題開發了一個特定的芯片或解決方案,解決方案和算法會隨着時間的推移而改變,這樣就會開發出很多特定的芯片和解決方案,然後就必須應對新的指令集,並在這麼多不同的芯片上創造生態系統。


2018年雙11,周靖人領導大數據智能計算團隊,支撐雙十一交易洪峯。2分05秒100億元,以及實時日誌處理峯值每秒17億條。
2020年在阿里內部組織變革中晉升。2022年12月,他正式任職阿里雲智能CTO,兼任達摩院副院長。
在阿里巴巴,他曾涉獵的工作包括了:淘寶事業羣搜索推薦、達摩院智能計算實驗室、阿里大數據智能計算和搜索推薦平台。
2、推動MaaS在阿里內部落地
根據媒體AI科技評論的報道,2021 年 3 月達摩院發佈國內首個千億參數多模態大模型 M6。那時周靖人作為項目主導人,從立項開始就思考如何更好地釋放像 M6 這樣的大模型的基礎能力。
報道提到,他思考的結果是——必須要有一個平台作為依託。在內部討論中,這個想法一出來,就得到了達摩院各個實驗室帶頭人的贊同。並且周靖人不斷地把「模型即服務」(Model as a Service,MaaS )的理念在內部推動頭腦風暴。
2022年,阿里達摩院與 CCF 開源發展委員會聯合正式推出國內首個 AI 模型開源社區——魔搭 ModelScope。把300 多個模型開放給整個中國的 AI 研究者與團隊,涵蓋了自然語言處理、視覺、語音、多模態等模型。
魔搭社區的核心關鍵詞是:開源。當時周靖人在接受媒體採訪時,提到其口號是:「 AI for Everyone」周靖人解釋了這句話的含義:無論是 AI 興趣愛好者,還是使用者、開發者、研究者,“模型即服務”理念均能承載不同人羣對AI 的訴求,進一步落地 AI 應用。
我理解,魔搭是意圖通過MaaS在具體商業場景中落地。平衡學術與應用。
“大模型的研發不應該是一場少數機構的競賽,而應該通過大小模型的協同進化走向更高級的應用,尤其是適應中國本土需求的應用。”
作為中文大模型。,2022年11月 CSDN創始人蔣濤曾對話周靖人探討了 AI 模型社區魔搭 ModelScope,以及背後包括瀾舟科技、智譜AI、深勢科技、中國科學技術大學等多家科研機構的開源生態。
周靖人提到了國內關於AI大模型的應用落地挑戰:
“AI 模型難以覆蓋各行各業的 AI 應用需求,面對新場景時,往往需要進行二次開發或優化,否則許多模型難以適配到特定環境應用中,AI 模型定製化門檻較高。以及缺乏 AI 模型開發和使用交流分享的平台。當開發者遇到相關問題後,無法找到對應的模型服務,也找不到人來解答他的問題。”
“達摩院提出模型即服務(Model as a Service)。背後邏輯是把 AI 模型當作生產的重要元素,從模型預訓練到二次調優,最後到模型部署,圍繞模型的生命週期來提供相應的服務。”
周靖人也提出了做法:
一是提供模型倉庫,收集模型,提供優質數據,還可針對業務場景調優。模型使用和算力需結合在一起,並提供快速體驗模型,讓廣大開發者無需寫代碼就能快速體驗模型的效果。
二是提供抽象接口或 API 接口,以便開發者針對模型進行二次開發。當面對具體應用場景時,提供少樣本或者零樣本的方式便於開發者對模型做二次優化,真正讓模型應用到不同的場景中。
2022年,魔搭上比較成熟的模型包括:瀾舟科技的孟子系列模型,深勢科技的蛋白質結構預測模型 Uni-Fold,智譜 AI 的多語言預訓練模型等。
在CSDN的訪談中,還提到魔搭的商業模式突破。對比Huggingface 從明星項目 Transformer 庫入手,隨後構建平台讓用户可以託管相關的機器學習模型和數據集,還可共享、協作與投入生產應用,目前在國外生態蓬勃發展。
周靖人認為魔搭社區填補 AI 模型應用服務的空白,建設 AI 開發者生態。魔搭更關注本土需求,提供大量中文模型,第一批提供的中文 AI 模型已超過 100 個,覆蓋自然語言處理、語音等常用任務。
3、AI與雲到底是什麼關係。
AI 模型涉及大量的數據、算力,脱離雲,在線下很難找到適合的機器來運行,AI 模型的開發和使用目前需要在雲計算之上。(魔搭對接了阿里雲機器學習平台 PAI 和彈性計算 ECS)
在兩週前的阿里雲數據庫北京峯會上,阿里雲智能CTO周靖人也在當天的演講中提到一點:“把數據能夠有效地管理起來,特別是今天我們如何做好數據的存儲、數據的分析。如何使用好數據,也發生了一系列的範式的轉變。”
2023年春,AI讓大眾使用ChatGPT、微軟辦公軟件,能夠支付得起費用的人羣直接步入AI紀元,雲和AI真正到了生產力飛躍的奇點。
不久前,在訪談阿里雲數據庫負責人李飛飛時,也瞭解到。
他認為:過去一二十年是信息時代數字化,也就是説企業的信息化辦公實現了數字化。AI到了臨界點,一定會催生這麼兩件事,一個叫物理世界數字化,還有一個是生物世界數字化。數據庫在這裏會發揮什麼樣的關鍵作用?第一,多模態的數據一定會成為事實標準,因為宏觀世界數字化、微觀世界數字化各種各樣的數字一定會層出不窮,數據的多樣性就像生物有多樣性,數字化的世界裏數據也是有多樣性的。
僅僅回到雲服務中的數據庫緯度,多模態數據的存儲和處理會促進處理多模態數據庫爆發式增長。
雲計算是以算力為基礎,以數據為核心,以技術為牽引——這是計算算力的服務化,這就像是電力服務化一樣。算力服務化以後,使之有意義的是數據的注入,因此物理世界數字化、生物世界數字化進一步映射。而以ChatGPT為代表的多模數據應用和背後的算法架構成為趨勢後,算力+數據+智能,這是期待已久的數據核裂變。

本文部分觀點,參考阿里雲數據庫負責人李飛飛的演講。