從AI開放平台,到工業大生產基座:重新認識百度大腦5.0_風聞
脑极体-脑极体官方账号-从技术协同到产业革命,从智能密钥到已知尽头2019-07-03 20:09
時間推進到2019,當我們在今天提到AI時,絕大多數聲音已經不再提及下圍棋的神奇,而是關注AI如何走向千行萬業,為國民經濟提質增效。
根據麥卡錫早些時候的報告,未來AI技術90%的價值將發生在與各行業的結合,並且到2030年將創造超過中國與印度GDP總和的產業價值。毫無疑問,今天每一雙眼睛都在緊盯着AI,好奇地審視着這一切到底會不會發生、如何發生。
顯然,當眾多觀眾、媒體與AI開發者一起來到百度AI開發者大會的時候,大家都希望看到一些關於產業智能化的新思考與新答案。畢竟百度是中國AI技術的名片,一個AI領域的新推動從百度開始,似乎已經被認為是合情合理的。
而百度也確實接住了這些期待。在百度AI開發者大會2019的主論壇上,百度CTO王海峯宣佈百度大腦升級為5.0版本。而對這一次升級,王海峯將其表述為“百度大腦5.0全面升級成為軟硬一體的AI大生產平台,希望能夠深度賦能產業開發者,加速產業智能化進程”。
可能各位的問題已經隨之而來,從AI開放平台到AI大生產平台,到底是什麼樣的變化支撐起了百度大腦的角色變化?讓AI邁入產業世界,實現AI與工業大生產的融合,究竟需要達成哪些條件與基礎?
AI技術與產業融合,從案例級別的“可以”,到千行和萬業真實觸發的“可以”。產業智能包含兩個層面的含義,一是智能技術來到了產業化週期中,可以用更符合社會化大生產的方式向市場提供技術與解決方案支持;二是產業需求可以廣泛應用AI技術,在其過程中成本可控、難度可接受。
換句話説,AI必須以工業的方式,進入工業世界。那麼我們想要認識百度大腦5.0的全新定位與價值時,似乎要先回到更遠一點的記憶中,回到工業大生產的肇始。
1769年,老約翰的工業之心
18世紀中葉的倫敦,舉世聞名的大霧還沒有來到它的峯值。
老約翰是一位老式織坊的主人,他正在籌劃將數十年的積蓄拿出來,開一間已經在這座城市流行起來的紡織工廠。
但是嚴謹的老牌教育和學者作風,讓這位未來的工廠主在投資之前,把開工廠這件事拆分成了很多個環節,從頭開始審視自己的事業從小作坊邁入工業時代的所需前提。
經過大量走訪和調查,老約翰把工廠能夠成功的基礎條件歸納成了三點:
1、技術達標:機器要能夠滿足生產差異化產品的需要,而不是論文與博覽館中的玩物。
2、充沛供給的能源和原料:煤炭和羊毛要能源源不斷運送到自己的工廠裏,否則工業生產很快將無以為繼。
3、完整的產業鏈:技術工人、技術專利、半成品、市場客户,這些產業條件必須都能在倫敦附近找到,否則任何一個地方的缺失,都將讓自己的工廠化為泡影。
在確認了泰晤士河沿岸可以滿足這些需求後,老約翰開始了行動。當時的他並不知道自己參與了被後世稱為改變人類歷史的大事件。但這些樸素的認知,構成了一顆最基本的“工業之心”。
然後讓我們將時間向後撥動250年,AI技術已經擁有這顆“工業之心”了嗎?
能夠觸發想象力的技術體系
跳回21世紀的此時此刻,我們不難發現,一個技術是否能達成“工業化生產”的標準,一方面取決於其價值與通用性,一方面也取決於其本身發展是否能夠滿足老約翰得出的三個工業結論:技術達標、能源穩定,與產業鏈完善。
回到百度大腦5.0的升級,我們可以看到龐大的升級事項背後,其實正一一對應着工業化大生產這三大基本條件。
首先來看AI的技術標準問題。到今天,差不多每個人都能夠説出幾種AI技術,比如人臉識別、語音交互等等。但是對於複雜的工業場景來説,單一的語音或者機器視覺技術確實能夠解決特定問題,但顯然無法滿足複雜產業情景與定製化形態的綜合工業需求。
比如説在今天的AI開發者大會上,王海峯現場演示了與機器人茶博士的互動。在多個AI技術的加持下,機器人茶博士能夠聽、看、理解並執行復雜命令。其顯然具備了複雜工業應用的可能,但卻是今天一般企業難以獨自研發和應用的。
或許我們可以將AI技術走入複雜工業場景這件事中,畫上一條AI技術的產業應用標準線:標準線以下,企業只能應用到單一的AI技術,要在自身產業縫隙中尋找這種技術應用到何處;產業標準線以上,企業將獲得大量前沿技術組成的技術條件,在此基礎上發揮創造力甚至想象力。
這條標準線並不容易突破,去年百度大腦3.0中升級的多模態深度語義理解技術,已經讓我們看到了技術突圍的序曲。而在百度大腦5.0的技術升級中,眾多超越我們對AI傳統認知的技術紛至沓來。
百度大腦5.0,在語音、視覺、語言和知識這幾大核心AI技術領域,發佈6項技術突破:
語音方面,發佈了流式多級截斷注意力模型(SMLTA),使語音識別速度和識確度大幅提升,可解決中英文混合語音的識別;風格遷移的語音合成技術,僅需20句話就可以製作一個人的專屬聲音。
而在視覺方面,百度大腦發佈了全球首個基於視頻流數據實時生成虛擬形象的“實時虛擬形象”技術方案,可以將一個人的形象和舉動,實時流暢轉換為另一個人的形像、話語、動作、表情等。
語言層面,百度大腦升級了基於知識圖譜的視頻語義理解能力。而知識增強的語義理解框架ERNIE已經累計學習10億以上的知識,全面刷新了中英文雙語自然語言處理任務效果。
這些每個都值得單獨成文技術帶領下,百度大腦形成了適應產業需求的全新形態:
1、技術種類足夠豐富,AI開放能力達到210個,能滿足各行業不同垂直需求。
2、技術深度達成突破,前沿技術能夠重新激發行業想象力,與行業深度結合。
3、技術體系的模塊化與融合能力,在百度大腦5.0版本中,已經有大量技術呈現出多種技術融合的特徵。而多模態與模塊融合,又是產業智能向深處發展的必要條件。
平心而論,雖然今天到處都在討論AI,但AI技術在核心算法上的突破我們卻聽到的極少。扛着最大挑戰向前走的百度大腦,正在用底層技術換取產業AI的核心生存空間。
牢靠的計算底座
我們知道,AI三要素是算力、算法和數據。如果説算法的突破是生存技術與生產工具,數據是行業生產原材料,那麼算力就是AI走入工業化生產時的能源。
百度大腦在算力基礎的進展,可以看作對AI產業化應用中,關於“工業能源”問題的解決方案。
在升級百度大腦5.0版本時,王海峯同時宣佈百度大腦構建了一套端到端適配的AI計算系統,通過芯片連接系統和調度的協同設計和技術創新,為開發者提供百萬TOPS的算力。
我們知道,今天的AI計算領域正在收穫廣泛的關注和研發投入。但從芯片層到開發、應用層之間的計算架構問題,是產業內普遍處於缺失狀態的環節。因為計算架構不僅需要對芯片和底層算力的理解,同時需要對算法開發和模型訓練具備深度理解,從而保證兩側之間的調度協同既不浪費算力,又能充沛保證AI加速需求。
這個層面的進化,可以説是百度大腦將自芯片到應用層所有環節都進行了創新補完。新的計算系統還可以緊密結合飛槳的訓練架構,提供面向算法優化的集聚效率。
結合去年發佈的自研雲端全功能AI芯片“崑崙”,以及剛剛發佈的專為遠場語音交互打造的芯片“鴻鵠”,圍繞百度大腦,已經形成了通用AI加速芯片、專用AI加速芯片、端到端AI計算系統組成的“算力鐵三角”,穩固了AI走向產業化所需要的能源供給。
AI操作系統的通衢
回到工業革命時的產業標準,我們會發現還有一個問題是產業鏈搭建。或許大家會奇怪,百度大腦作為一個平台,如何滿足產業鏈的需求?
答案在於飛槳。被定義為AI時代操作系統的飛槳,其本身價值即是產業鏈的集成。在底層工具之外,飛槳還將扮演產業鏈中樞的角色,為開發者和產業應用者提供產業向工具、定製化服務,以及產業生態和新的市場觸達可能。
某種程度上來説,飛槳所處的AI操作系統層,恰好是處在算力層與應用層的中間地帶。這個層面的平台,既保證了高可用性和生態活躍,同時也具備模塊化、標準化、自動化的產業基礎平台性質。所以飛槳很可能成為產業AI時代的中樞,保證技術縱向與產業橫向的完整和高度開放。
飛槳的關鍵在於“通”,這件事在不久前的首屆百度深度學習開發者峯會上已經得到了展示,飛槳的全面圖景容納了產業智能化的種種需求。不同領域、不同技術基礎、不同任務環節的AI開發者都可以在其中獲取幫助。
而在百度大腦5.0升級中,百度大腦與華為麒麟又聯合宣佈了一個重磅的“通”。王海峯與華為消費者BG軟件總裁王成錄博士聯合宣佈,百度飛槳將與華為麒麟芯片進行深度對接,用全球領先的端側AI芯片和中國自己的“AI時代操作系統”為端側AI提供最強勁算力、打造最好的深度學習運行效率。
這條新的通衢,具有兩方面的產業意義。一來百度飛槳生態中的深度學習開發者,將可能獲得通向移動AI時代與產業紀元的船票,觸發全新的市場機遇;二來華為HiAI開發生態將獲得更高效的開發效率與開發深度,真正藉助百度的深度學習技術積累,將移動AI推向更廣泛的發展空間。
AI操作系統+端側AI芯片,這個組合今天確實僅在中國才有。中國的產業智能時代,就孕育在這些技術差異化到產業差異化的機遇與變革裏。
2019年,百度大腦的產業AI集結號
蒸汽機和煤炭代表的工業革命250年後,人類經歷了電氣革命、信息革命,終於抵達了智能革命的門前。
但是智能革命的大門怎麼敲,卻是一個正在探索進行時的問題。而在AI走入產業智能化階段,有一個核心問題其實很少被大眾關注:量變。
我們都知道,AI在理論和邏輯上可以與產業結合,順着數據與邏輯推理,產業智能可以帶來難以想象的經濟價值。然而拋開量變談事件發生的必然性,基本等於耍流氓。如果AI算力始終不夠、AI算法始終無法滿足複雜工業需求、AI產業在實踐中總是缺乏產業對接效率,最終的智能革命會發生嗎?
顯然,第四次工業革命不會孕育自空想。只有一點點技術突破積累,產業基礎逐漸完善,生態真正建立,最終恢弘的產業AI時代才能拉開大幕。
王海峯認為,自2010年左右百度開始積累AI技術,百度大腦其實就已經進入了0.0時代。百度大腦近十年一步步地走來,就是那個中國AI醖釀量變的過程。
百度大腦5.0的升級發佈,對於AI行內人來看有點像特效滿滿的好萊塢大片。每一項技術升級都足夠震撼,完全值得單獨拿出來舉辦一場發佈會。但是百度大腦一次性拿出來了“一羣”帶着足夠震顫感的創新升級。這或許能在一個側面表明,量變到質變的時刻確實臨近了。
回顧過去,我們會發現百度大腦的每次升級,都着重強調技術怎樣,而不是目標怎樣。直到5.0,各層級的突破疊加後,百度大腦開始表露清晰的目標——各環節達標,各條件被滿足之後,接下來百度大腦將作為AI時代的工業化大生產平台。
至5.0時代,百度大腦的特質已經呈現為一個“三全平台”:
1、全週期軟硬件一體化平台:從芯片、開發框架、應用層,到硬件系統的全面貫穿,滿足工業級應用和大規模部署所需的併發性、兼容性與穩定性。
2、全應用流程調用:從深度學習基礎技術,到通用AI能力、應用技術方案,再到定製化模型,以及最終的部署與集成,一個平台打通AI產業應用的全部流程,滿足產業落地需求。
3、全AI底層技術容納與融合:在語音、視覺、自然語言處理、知識圖譜領域具有廣泛多元的技術部署與技術領先性,滿足不同行業、不同企業,不同應用週期的需求。
“三全”的百度大腦5.0,接下來的任務是適應更多行業的需求,讓更多企業加入塑造案例,搭建產業鏈,並且驗證產業智能化的實際價值模型、各AI技術的不同行業適配度、總結產業智能化方法論,最終證明證明everyone can AI。
現代智人有七萬年的歷史,而人類6000年前才進入青銅時代,250年前進入了工業時代。某種意義上來説,人類生產文明的發展,就是一場不斷超越自身紀錄的加速跑。
兩個半世紀之後,第四次工業革命也好,首次智能革命也罷,我們能目測到一場改變確實正在發生。既然工業革命的步伐始終都在加快,那麼為什麼不能發生在今天,發生在中國,發生在百度大腦生態裏,發生在你我身邊?
恰逢風雲,堪稱快哉。