不信不可能:飛槳,劃一個時代的初心_風聞
脑极体-脑极体官方账号-从技术协同到产业革命,从智能密钥到已知尽头2019-11-06 23:42
AI在哪裏?
大部分人可能會想到科幻電影,或者異常先進的實驗室。但是河北工業大學教授劉晶卻認為AI就在一間間工廠車間裏。學習了六年深度學習,花兩個月時間跑了一百多家鋼鐵廠,最終,她把在鋼鐵熔鍊複雜的配料過程中,老師傅們練就的三十年經驗,變成了三秒就能給出最優配比的AI模型。
這個模型,每年可以為鋼鐵企業節省10%的原材料,把配料計算時間節省了90%。而她能做到這一切、把不可能化成可能的基礎,是應用了百度的飛槳平台。
這一秒鐘,千千萬萬個這樣的故事,正同時上演在中國廣袤的大地上。AI不在別處,AI就在這裏,在我們的農田、工廠、礦山、辦公室,在萬家燈火渺渺炊煙中。
AI從天邊來到千行萬業去,從不可能變成可能,就是一段完整的關於飛槳的故事。
(百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峯)
11月5日,“WAVE SUMMIT+”2019深度學習開發者秋季峯會在北京召開,AI開發者再熟悉不過的、被稱為AI時代操作系統和百度AI底座的飛槳,又一次迎來了大規模技術升級。
畢竟還有不到兩個月2019就要結束,在關注飛槳狂飆突進的速度之外,此時或許有必要回望一下關於飛槳走過的路,未來的方向,以及不變的初心。
在這些故事、邏輯和藴藏的情感裏,我們可以真實地讀懂百度AI,讀懂深度學習開發者,讀懂中國智能時代的黎明。
盛宴:百度AI的彪悍速度
也許我們的讀者都還記得,今年4月,百度曾主辦了首場深度學習開發者峯會。當時很多讀者給我們留言,表示飛槳升級的技術實在太多了,只是讀完都感覺腦子有點跟不上。也有讀者説,別人家都是一場發佈會説一兩個技術,百度是一場發佈會説一打技術。
到了秋天,我們發現百度顯然決定在彪悍之路上一條道走到黑。這次的深度學習開發者峯會上,飛槳一口氣發佈和重要升級21個產品方向。沒錯,一打已經不夠用了。
峯會現場,不少媒體同行和開發者表示,技術實在太多,邊聽邊記都跟不上速度——而百度居然就生猛地把它們一個個做出來了。
會上,百度深度學習技術平台部總監馬豔軍博士,介紹了飛槳產業級深度學習開源開放平台全景圖,詳解了飛槳全新發布的21個產品方向。
其中,十分引入矚目的是,飛槳全新發布了4大面嚮應用任務的產業級端到端開發套件。包括NLP領域的ERNIE語義理解,CV方向的PaddleDetection目標檢測和PaddleSeg圖像分割,推薦方向的ElasticCTR點擊率預估,在關鍵產業應用中,滿足低成本和快速集成需求。
而全新發布的端側推理引擎Paddle Lite 2.0版本,則進一步提升了飛槳在硬件端的易用性和兼容性,具有超高 INT8 量化性能。
此外,飛槳還全新發布了3項深度學習技術工具組件:聯邦學習PaddleFL、圖神經網絡PGL和多任務學習PALM,從而將最先進的技術帶到產業實踐中。
EasyDL則發佈了為算法工程師提供一站式解決方案的EasyDL專業版、PaddleHub 也全新升級,支持遷移學習與飛槳Master模式。
飛槳Master,也是本次峯會的一大亮點。這一模式把算力、數據、算法集成為產業級預訓練模型。與大量遷移學習工具平台配合,構成了產業底座,為產業AI開發者奠定了全面基礎支撐。
此外,飛槳還進行了動態圖全新升級、新增大量算子庫、優化API 接口,技術文檔更加完善;分佈式GPU訓練相比其他主流框架實現了20%-100%的速度提升,分佈式CPU訓練最大吞吐量達到行業6倍以上;官方模型從60+增加到了100+,提供預訓練模型超過200個;並且此次新開源了4個國際競賽冠軍模型;同時重磅推出了大量資源、課程、獎勵賦能的飛槳生態激勵計劃。
對於AI開發者來説,盛宴,當如是也。
初心:飛槳的來處與去處
在飛槳令人眼花繚亂的升級,保持超高速進化的背後,或許每個人都會想問這樣一個問題:到底是什麼支撐了飛槳的奔跑?他們會一直這樣跑下去嗎?
畢竟這一年裏,歐美主流深度學習框架的更新頻率並不高,而歐美大型科技公司對AI開發的技術升級也多次被批評過於緩慢。
當降速的歐美AI,碰上了飛速奔跑的中國AI與飛槳,我們當然會興奮,也自然會充滿疑問。百度AI技術平台體系執行總監、深度學習技術及應用國家工程實驗室副主任吳甜,對這個問題的回答是,飛槳的升級動力來自百度AI團隊與產業開發者的高效頻繁溝通。
今天的飛槳,已經深深紮根於產業環境和開發生態當中。來自各個產業的AI需求、挑戰和瓶頸會隨時反饋給飛槳,開發者遇到的問題與挑戰會隨時與百度溝通。在這個開放和高效運轉的空間裏,百度的AI科學家們與產業開發者形成了一個整體。開發者需要什麼,飛槳就去做什麼;產業智能化遇到了哪些無法克服的問題,百度就去調兵遣將解決它。
這樣的模式,是封閉在小環境中的互聯網公司所無法完成的,飛槳的奔跑,來自百度對技術的探索和追尋,同時也來自開發者和產業的真實聲音循環反饋。對此,我們的感觸也十分清晰,記得今年上半年在百度黃埔學院第一期畢業禮上,我們與開發者討論飛槳還有哪些問題。如今半年過去,這些問題真的已經被一個個升級所擊破。
其實不管是大規模分佈式訓練、全硬件平台支持、工業級模型庫,還是幾大領先世界的AI操作系統特性,飛槳的背後,是對一個簡單目標的極致化:讓AI開發具備更高性能、更低門檻。
這是飛槳的初心,而圍繞這個初心的窮思竭慮,變成了飛槳的升級速度和產業廣度。
圍繞開發易用性和開發性能升級,本次飛槳大規模升級裏,有兩個關鍵點可以作為很好的解讀點。
一個是Master模式的誕生。所謂Master模式,從邏輯上看就是飛槳基於大量產業實踐,總結出產業AI開發者到底需要哪些數據、算法和算力。然後飛槳將其最大公約數變成預訓練模型。而對於企業來説,只要在此基礎上進行小規模的數據標註,就可以省去複雜模型的研發成本,以及龐大冗長的訓練流程,快速把AI能力結合到場景應用。
這是一個高強度面向產業實際應用的模式。它是百度AI技術的高度集成和沉澱,同時也來自飛槳對產業真實應用具體而微的理解,必須保證預訓練模型與產業最大效率接軌。百度一位專家,把Master模式比作飯館做菜時候的那鍋老湯——產業應用者只需要享受一勺下去味美絕倫,而不用等待漫長而複雜的熬製過程。
再一個就是上面所説,飛槳端到端開發套件的發佈。今天的情況是,眾多產業開發者並不具備深厚的AI功底,但需要迫切能解決問題的AI能力。端到端開發套件,就可以讓一個只有基礎編程能力的技術人員,利用套件工具來解決具備主流應用性的AI問題。比如語義理解是智能語音相關AI問題的核心;視覺分割和圖像檢測是機器視覺能力最大的應用需求;CTR推薦具備從互聯網到實體經濟極其廣泛的應用覆蓋度。飛槳把這些套件提前做好,就可以把相應問題的AI開發門檻降到最低程度,產業可以無縫進入AI時代。
這些技術與產業智慧的碰撞結果,是將飛槳打造成了源於產業實踐,與產業共進的深度學習開源開放平台。而未來,飛槳還會繼續進化,畢竟核心框架的進化還在進行時、開發者的需求還有無窮無盡、中國產業智能化的大門剛剛開啓。
(百度AI技術平台體系執行總監、深度學習技術及應用國家工程實驗室副主任吳甜)
吳甜認為,未來飛槳還會持續發展超大規模分佈式計算、異構計算能力,定位於全硬件平台支持、端雲邊結合。深度學習平台還要繼續向前,推進核心框架持續向完美髮展;而飛槳的四大領先特性也會持續前進,堅持面向產業級應用,挖掘中國全產業擁抱AI的可能。
飛槳的去處,歸根結底是百度AI科學家們看到了這樣一個機會:中國擁有最廣泛全面的產業鏈,而飛槳則提供了當今最快的AI基礎設施進化速度。
廣和快的碰撞,往往是奇蹟的原點。
承擔:智能時代的中國情懷
很多西方學者都提出過這樣一個觀點:中國的現代化進程,尤其是近年的經濟騰飛,堪稱集體主義在人類文明史中完成的奇蹟。
中國人的經濟智慧,是調集力量克服困難,哪怕承擔一部分犧牲,也要把基礎做好,把起點做紮實。然後在此基礎上建設產業、發展生態,讓智慧的中國人有舞台騰飛。從互聯網、通訊、高鐵、城建莫不如此,這也是中國之所以被稱作“基建狂魔”的原因。
AI時代,人類正在悄然抵達第四次工業革命的起點。而過往的三次工業革命,東方更多時候都是看客。這次,中國AI和產業智能化顯然不想再旁觀和等待了。
那麼誰來擔當中國AI時代的“基建狂魔”呢?
自2016年正式開源以來,飛槳是中國首個也是目前國內唯一全面開源開放、技術領先、功能完備的產業級深度學習平台。它的功能與特性,已經可以支持超大規模的工業級AI開發,為產業AI擔當工業大生產底座。
所以中國人的視野和情懷中,百度與飛槳責無旁貸。
事實上,在經濟放緩和行業資金鍊下行的大背景下,百度發展飛槳是很容易理解的。但如此超高速發展,屢次完成令世界驚訝的升級,確實是逆勢而行、萬人亦往的。飛槳升級不僅意味着巨大的投資,同時也意味着龐大的頂級人才投入,以及大量與產業開發者的交流溝通工作、巨大的教育和人才培育投入。
但是路總要有人修、石油總要有人找,產業AI基座總要有人去建。百度在此刻,承擔了一個令萬千開發者、令無聲的中國產業生態非常欣慰和驕傲的角色。
烏鎮互聯網大會上,百度CEO李彥宏首次提出了智能經濟。智能經濟不會招手而來,它跟石油經濟、電力經濟一樣,要從鑽井、電站做起。於是百度的選擇是,拿起飛槳,就去劃開一個時代好了。
百度CTO王海峯判斷,具備了標準化、自動化和模塊化的基本特徵,正在讓深度學習推動AI進入工業化大生產階段。這個階段裏,百度的AI技術以及對AI開發的理解,沉澱為飛槳這個技術底座。讓飛槳變成上接應用、下接芯片指令集的AI操作系統。
這種產業模式,事實上已經發展出了中國AI獨有的產業生態原點。谷歌Tensorflow代表的主流歐美框架,並沒有集成開發者大量對工具、套件、預訓練模型、定製化服務的產業需求,也缺少工業級AI訓練開發的支撐特徵,以及與產業互動的高強度方案。
這些是飛槳的獨創,也是中國AI悄然發展出的一步優勢。中國的各行各業,全產業鏈都可能從中受益。
深度學習和飛槳,正在成為與中國未來魚水相融的時代之路。
如鋼鐵,如秋實,如夢幻:飛槳的一年
寫到這裏,突然有種一夢忽醒的感覺。幾年來,我們都在跟蹤報道飛槳的快速進化。尤其在今年,飛槳可以説真正衝破了產業級的壁壘,極大程度打開了AI與現實世界的融合。
雖然飛槳是一個個技術與工具構成的,但卻很容易從它和它背後的百度人那裏,感覺到飛槳的温度、執念和情感。
採訪中,我問吳甜和馬豔軍兩位博士,對飛槳一年來變化最大的感受是什麼。
吳甜提到了車間。飛槳這座車間裏,以前是一些簡易的流水線設備,對技工的要求很高。但現在車間裏做出了高級車牀,誰進來都可以很快開始生產自己想要的零件。而未來,飛槳會變成充滿高精尖技術,現代化的,世界最領先的AI車間。
而馬豔軍提到了房子。他説毛坯房也能住,精裝修房屋也能住,但生活品質是不一樣的。飛槳這一年就是在把這座房子進行了精裝,而且是生態化、環保化的精裝。並且蓋着蓋着房子,還蓋出了很多新的東西來。而大家覺得飛槳的升級令人目眩神迷,其實都是開發者的需求——建築師的初心,是給業主想要的。
(百度深度學習技術平台部總監馬豔軍)
如果説AI的邏輯是一場統計學的春華,飛槳則在這一年中讓它結出了鋼鐵般堅硬的秋實。金融行業苛刻到恐怖的數據要求可以落地于飛槳;工業流水線上精準到毫秒的時延條件生根于飛槳;企業主渴望AI,卻又難以承擔的成本難題,被飛槳的技術破解開。
飛槳把現實世界的不可能常識,變成了一切皆有可能的智能幻夢。
飛槳是什麼?
是深度學習開發者峯會上,一座難求的熱絡。
是一位位田野裏、工廠裏的AI開發者,他們的倔強、不甘,與最終得到無數喝彩時,眼中的淚光閃爍。
是百度科學家,深夜依舊在解答開發者問題時的疲憊和執着。
飛槳是這樣一個常識:如果我們跟眼前的困難握手言和,就會跟雄偉的未來擦肩而過。