昇思MindSpore兩週年:一個學習型開源社區的成長記事_風聞
Alter-2022-03-24 20:01

撰文 / 張賀飛
編輯 / 沈潔
2020年,應屆畢業的蔣倩成了一名算法工程師,因為工作的原因,蔣倩接觸到了剛剛開源的昇思MindSpore。
和許多開發者一樣,蔣倩對人工智能和開源社區充滿了好奇心,一邊在社區中學習深度學習的算法原理,一邊和別人分享自己的算法模型和技術教程。用他自己的話來説:“就像是一個升級打怪的過程,一開始自己也是一知半解,後來參加集訓營、在社羣中和大家交流,目前已經貢獻了多個算法模型。”
現在的蔣倩有了一個新身份,既是自己公司的“技術大牛”,也是昇思MindSpore社區認證的“佈道師”。像蔣倩這樣優秀的認證開發者,昇思MindSpore社區裏已經有300多位,其中不少人屬於小白到大神的進階式提升,他們在社區中不斷學習成長的過程,形象地勾勒了昇思MindSpore在過去兩年中的價值和意義。
藉助MindSpore TechDay的機會,我們不妨將目光聚集到開源的另一面,即一個開源社區和開發者們的成長曆程。
01 產業導向的進化
在昇思MindSpore正式開源前,AI框架已經流行了一段時間,經歷了Caffe、Theano代表的淺層框架,到TensorFlow、PyTorch代表的通用框架的過渡。可這些框架並不能很好地適應工業需求,要麼為了性能犧牲了易用性,要麼為了靈活調試而犧牲了性能,無法同時滿足易開發、高效執行的要求。
相較於那些學術性質的框架,昇思MindSpore有着鮮明的產業導向。在華為的AI戰略佈局中, Atlas系列硬件、異構計算架構CANN、全場景AI框架昇思MindSpore、昇騰應用使能MindX以及AI應用使能ModelArts等共同構成了相對完善的昇騰AI基礎軟硬件平台,其中昇思MindSpore可以在雲、邊、端等不同環境下進行開發部署,瞄準的是科研創新和產業應用。
蔣倩就是因為項目落地的需求,嘗試了海內外的多個AI框架後,最終和昇思MindSpore結下了不解之緣。所以不同於市面上的其他框架,昇思MindSpore的進化過程呈現出了兩個典型特徵:
一是立足於實際場景的落地應用。
昇思MindSpore在1.0版中就達到了生產商用的標準,開發者可以放心部署在實際的生產場景中;開源一週年時推出的面向入門級開發者的新工具 TinyMS,被不少開發者形容為“無痛上手極好用”;不久前更新的昇思MindSpore 1.6版本中,針對開發效率進行了進一步改進,控制流性能得到提升並支持副作用訓練。
二是將大模型作為開發的新範式。
大模型是連接技術生態和商業生態的橋樑,也是科研創新走向產業應用的重要樞紐,昇思MindSpore相繼支持了鵬程.盤古、紫東.太初等千億級參數的大模型,目的正是使能大模型的訓練開發,推動大模型在不同行業進行應用落地,進而串聯起產業鏈上下游的開發者,打通AI的產業化路徑。
基於這樣的產業佈局,昇思MindSpore的不少特性被開發者點贊,諸如自動並行、二階優化、動靜態圖結合、全場景部署、全棧協同加速等等,同時也讓昇思MindSpore在市場上迅速站穩了腳跟。截止到2021年底,昇思MindSpore已經支持300多個網絡模型,涵蓋CV、NLP、推薦等主流模型,服務了超過5000家企業,並在醫療、交通、金融、製造、能源等領域進行了商業化應用。
如果説兩年前的昇思MindSpore還是一個新生的嬰兒,目前已經步入到了風華正茂的青年時代,在飛速前進的時代步履下,正在扮演許多行業、許多企業、許多開發者奔向人工智能康莊大道的“同行者”。
02 與開發者共成長
開源社區和開發者的關係,就像是大海和河流。在談及開源文化的時候,被提到最多的詞彙就是貢獻。但中國還是一個開源文化貧瘠的市場,“拿來主義”曾經是很多開發者對開源的理解,想要在國內迅速構建起有生命力的開源社區,勢必要創造出一套適合中國市場現狀的新秩序和新文化。
昇思MindSpore奉行的原則是“開發者第一”,打個比方:就是讓開發者站在“巨人”的肩膀上成為“巨人”。於是昇思MindSpore社區意在營造一種共生的環境,和開發者一起進行創新創造,一起學習成長。

在多個開源社區中註冊過賬號的蔣倩,將昇思MindSpore社區看作是學習型社區,並盛讚社區所提供的“保姆式”服務:
“首先需要點讚的是昇思MindSpore的低門檻,裏面的很多工具降低了我們學習AI的技術要求,比如TinyMS提供了WEB UI 項目容器化快速部署,不需要代碼就能在web界面體驗圖像識別,上傳待推理的圖片即可返回模型推理結果,目前已經支持LeNet5 數字識別、CycleGan 風格遷移、目標檢測等多種任務。”
“然後讓人印象深刻的是社區的運營,可以在B站、公眾號等渠道看一些技術內容,通過社羣和其他開發者聊天,官方還舉辦了很多針對開發者的活動,我就參加過集訓營和開源創新實踐課,這些活動並未過多佔用我的時間,卻在短時間裏學到了很多東西,有很大的成長和收穫。”
除了蔣倩提到的技術創新和運營活動,“保姆式”服務的內涵還體現在面向社區開發者的認證體系。
早在2020年5月份,昇思MindSpore就發佈了國內首個AI開源社區的認證開發者體系,2021年沉澱出了相對完善的“英雄進階體系”,與後來諸多社區認證相比,昇思的開發者認證規模大、分層細(包括優秀開發者、資深開發者、佈道師和資深佈道師4大級8子類)、透明高(B站有大量答辯錄屏),為開源開發者打通了一條極具AI特色的從0到1的成長路徑。

昇思MindSpore的利他主義精神,換來的不僅僅是開發者的成長,也為自身在開源世界博得了一席之地:昇思MindSpore的總下載量超過140萬次、擁有4000多位核心貢獻者、2021年就發表了300多篇基於昇思MindSpore的AI論文……同時越來越多的開發者正在加入昇思MindSpore,用一磚一瓦砌出中國的開源文化,傳播人工智能的技術火種。
03 詮釋開源的力量
開源世界裏流傳着一句著名的格言:社區重於代碼。對於這句話的含義,坊間有着不同角度的解釋,華為計算開源業務總經理堵俊平也表達過自己的理解:“通過開源社區,開發者接觸到新場景、新技術,並把這個技術使用經驗反饋回社區,發生一些化學反應,產生創新的機會。”
為了踐行這樣的理念,昇思MindSpore建立了一整套運營和管理機制,涉及泛內容平台、開發者活動、開發者社羣、社區治理、生態合作、基礎設施等內容,試圖打造一個有競爭力的開源社區,讓AI更好地普惠大眾。
昇思MindSpore社區比很多老牌社區年輕了許多,但這並不妨礙小孢子(昇思MindSpore開發者的暱稱)們詮釋開源的力量。
MSG Women In Tech沙龍是昇思MindSpore社區社羣活動特色的一個縮影,通過為科技從業女性提供一個多元包容的討論窗口,推動有關科技與開源多樣性的有益討論,而這些討論並非空談——它們在諸多女性開發者的努力下,真正落地成為了開源共享的方案。比如AI和加密藝術家宋婷在活動中接觸到了昇思MindSpore,通過對世界保護非物質文化遺產——扎染的圖案進行訓練,能夠基於GAN模型生成新的扎染圖案,以一種數字化的方式讓雲南少數民族的傳統文化在時光流逝中不被磨滅。

山水自然保護中心自2011年開始在野外開展紅外相機調查與長期監測,積累了大量紅外相機數據,但照片的處理、識別和分析卻要靠肉眼進行。在和昇思MindSpore社區溝通後,達成了開展野外場景下紅外相機照片 AI 物種識別模型訓練的合作,紅外相機拍攝的照片交給AI模型進行初步的識別和篩選,再由志願者對識別結果進行檢查和修正,極大地提升了照片的識別速度。
同樣有説服力的,是“開源之夏”對一些開發者的專訪,其中武漢大學的博士研究生謝晴興在採訪中表示:“興趣很重要,只有熱愛才能讓自己一直堅持下去。根據自己的興趣選擇一個適合自己開源項目,然後持之以恆地做下去。”
或許這就是昇思MindSpore社區想要的結果,開源社區的重心或許從來都不是代碼,而是激起開發者的熱情和熱愛,做一件讓自己快樂、有意義、有價值的事。

目前昇思MindSpore社區已經是國內第一熱度的AI開源社區,官網訪問量超過6300萬次,在碼雲開源項目中綜合排名第一。這些數字遠不足以概括開源社區的價值,很多開發者在昇思MindSpore社區找到了志同道合的人,找到了他們熱愛的事情,然後用自己的擅長方式“改變世界”。
04 關於TechDay
如果你也想和昇思MindSpore一起成長,千萬不要錯過下面的重要信息:
3月26日和27日,昇思MindSpore社區將舉辦首屆MindSporeTechDay活動,屆時將有MindSpore1.6版本、TinyMS V0.3版本的重磅更新,以及一大批開發者現身講述自己的成長故事和職場經驗,還有李永樂、稚暉君等“大咖”登台互動,去年讓人眼前一亮的AI開源吐槽大會也將迎來第二屆……
這是一場關於“成長”的線性敍事,以上不過是故事的第一個章節。如果你也是一位有理想的開發者,或許可以選擇和昇思MindSpore一起成長,書寫屬於你的故事和篇章,一同用腦力和體力點燃中國AI的星星之火。