最強AI算力哪裏來?三個時代的阿里疊影_風聞
脑极体-脑极体官方账号-从技术协同到产业革命,从智能密钥到已知尽头2019-09-27 12:21
又是一年雲棲時。
阿里的雲棲大會,堪稱科技眾的年度狂歡之一。而今年似乎格外特殊,阿里雲十歲生日,阿里巴巴集團20週年,似乎都讓今年的雲棲有點不同。而從技術從業者的角度來看,或許另一個不同更加引人注目:被廣泛認知為互聯網公司的阿里,今年雲棲上唱主角的居然是一款AI芯片。
9月25日,達摩院院長張建鋒現發佈了“全球最強的AI芯片”——含光800。在AI行業目前被廣泛作為標準化測試的ResNet-50中,含光800推理性能達到78563IPS,刷新了AI推理芯片的世界紀錄。
如果站在大眾輿論中看,或許我們很難把阿里和“最強AI芯片”這兩件事聯繫在一起。也許會認為其中充滿了反常識和突如其來。
但如果站在計算與智能產業的時間迭序上看,或許會又對含光800抱有完全不同的看法:這枚最強AI芯,並不是阿里的轉型之作。反而阿里始終在踐行為產業提供最強AI算力的路上。平頭哥的第一次“雲棲秀”,則是這條路上自然而然醖釀的結果。
從雲到AI,阿里就像一位遊戲玩家,再每一個版本的副本中都拿到了關鍵道具。而在快速流轉的AI時代,這些關鍵道具組成了“阿里套裝”——作為產業底座的最強AI算力,就是這個套裝的加持效果。
從雲、大數據、算法到芯片,雲棲的疊影凝固成了AI計算之路。
神奇AI算力在哪裏?
或許我們有必要先了解這樣一個理論:AI算力的差異化供給,究竟來自於何處?
去年5月,OpenAI 發佈過一份數據報告。其中提到自2012年以來全球AI算力需求在6年中擴大了30萬倍,AI產業的算力需求每3.5個月就在翻一番。
這個遠大於摩爾定律增長的需求裂變,意味着AI算力在這個產業週期裏必然面對大量供不應求的局面。這也就錨定了AI算力提供的第一條規則:雲是AI的最佳出口。
由於雲端算力天生具有能夠裁量提供的特點,這對於AI任務從訓練、測試到部署中廣泛面對的彈性增長、大規模並行部署、極端訓練用算力等幾大特點來説,具有難以取代的價值。瞬時性、併發性、彈力性,是AI對算力需求的基本面貌。
而在從雲到端、從訓練到推理、從部署到迭代的AI落地過程裏,我們可以看到AI算力的運行實際上受制於非常多的條件:計算架構、訓練集羣性能、框架對算法的優化程度、部署環境等等都在影的響AI算力的最終實際體驗。這個漫長的流程,決定了AI算力的第二條規則:算力性能的優越與否不取決於單純的芯片,而是由從芯片、雲、數據處理能力、框架,再到算法開發基礎、部署環境等一攬子條件來決定的整體閾值。
這意味着,AI算力不是一個單純的部件性能比拼,而是一個體系化工程,是產業技術疊加與AI基礎開發部署探索的完整序列。這意味着AI算力是一條路,這條路,需要不同時間的不同饋贈。
在時代收穫所需,這正是阿里雲的特點。
雲計算時代,飛天的路標與饋贈
我們知道了AI算力來自哪裏之後,就可以來看阿里雲的收穫過程。雖然我們今天的焦點是平頭哥,但故事的開端其實早在十年前就已經發生。
2009年,草創的阿里雲寫下了第一行關於飛天的代碼。當時這個“冒天下之大不韙”的團隊,就意識到大規模計算是未來互聯網的發展中軸,甚至是更多計算迭代的肇始因緣。
時至如今,這個判斷應該説已經被證明是正確的。阿里雲自研的飛天雲操作系統,已經成長位國內規模最大的計算平台,可擴展至10萬台計算集羣,單日數據處理量超過600PB。2018年雙11期間,阿里雲彈性計算能力累計超過1000萬核,相當於10座大型數據中心,創造了“脈衝計算”的新紀錄。雙11作為一個巨大的數據任務,某種程度上位飛天挺入智能時代,成為計算底座提供了驗證。
AI計算的本質,是對異構計算和多樣性計算的需求。為此,阿里雲提供在雲服務市場率先提供了異構計算服務。構築了亞洲規模最大的GPU公共雲服務,並可在短時間內實現全球最大規模的GPU服務器調用,超級GPU計算集羣支持每秒10億次AI峯值計算。此外,阿里雲還最早發佈了FPGA雲服務。
這些基於雲服務提供的大規模計算和異構計算,可以看作阿里雲最早投身公有云事業,在產業草莽期積累的時代饋贈。雲計算的支柱能力和多元架構囊括,是產業AI所需算力的基本構成。這層疊影成為了阿里雲提供AI算力的底色,是一切故事的起點。
而在AI逐漸併入產業視角時,坐擁強大多元的雲,讓阿里可以更兇猛投身這個新的產業紀元。
AI探索時代,向實而生的阿里三叉戟
假如説,十年之前是公有云時代的崛起;那麼從2016、2017年開始,AI時代逐漸在產業服務市場落地生根。
這個階段,早期探索同樣艱難充滿挑戰,但也給阿里的AI算力之路帶來了第二層底色:實用化。
2016年的雲棲大會,阿里與杭州一同公佈了城市大腦計劃。此後,隨着城市大腦計劃的陸續落地,阿里在2017年宣佈成立了達摩院。此後的產業分工,是達摩院承擔AI算法的開發與升級,而技術則通過阿里雲的AI解決方案與阿里生態進行應用轉化。
這一過程中,我們可以看到阿里的技術體系牽引起了AI算法、數據應用,與產業場景三個維度的走廊,構築了一把探索AI真實價值的產業三叉戟。
達摩院的AI技術與服務體系,先後在工業、遙感、醫療、城市大腦等多個應用場景中落地。而阿里小蜜、拍立淘、支付寶、天貓精靈則成為了阿里內部生態的AI出口。根據阿里巴巴在杭州雲棲大會上公佈的人工智能調用規模:每天調用超1萬億次,服務全球10億人,日處理圖像10億張、視頻120萬小時、語音55萬小時及自然語言5千億句,阿里已經成為中國最大的人工智能公司。
在AI應用時代早期,阿里通過一系列技術和組織部署,形成了技術先鋒營、數據轉化引擎,與場景實驗室的三個新角色,為AI算力走向實用化探索了落地入口。
AI芯片時代,平頭哥的萬里長征
如果對比CPU在70年代的歷史,可以發現AI從探索期走向實用化和成熟期,關鍵標誌就是核心芯片的大規模商用。
這個時代才剛剛開始,我們或許還無法代替計算史為它命名,但毫無疑問AI的芯片級基礎設施,是這個週期的關鍵開端。
曾幾何時,IBM從打印機走向了芯片讓美國人莫名其妙;而去年,阿里宣佈成立面向AI時代的平頭哥,確實也讓中國人大吃了一驚。
氣質獨特,生死看淡的平頭哥,在計劃中將為產業提供最全芯片產品形態,涵蓋處理器IP、SoC平台以及芯片。
不久之前,我們見到了平頭哥發佈了面向端側的無劍平台和玄鐵處理器IP。而當含光800面世時,則意味着平頭哥第一次挺進雲端,與阿里雲的計算、數據、算法體系連為一體,構成了雲端最強推理算力的萌芽。
含光800性能突破,得益於達摩院的軟硬件協同創新:硬件層面採用自研芯片架構,通過推理加速等技術解決芯片性能瓶頸問題;軟件層面集成了先進AI算法,針對CNN及視覺類算法深度優化計算、存儲密度,可實現大網絡模型在一顆NPU上完成計算。
根據雲棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800後可縮減至5分鐘。
雖然平頭哥的萬里長征剛剛開始,但是這第一步,確實已經跨了出來。
關於未來時代的疊影,平頭哥用含光800做了一聲怒吼,它的意思大概是,阿里將突入最底層,在計算基礎設施中完成對AI最強算力的探索。
雲,AI,到芯片,三個時代的疊影,讓最強AI算力自然流淌而出,雲氣萬物裏。