15個產業級算法推出、35個高精度預訓練模型上線!最強國產開源AI框架再進化_風聞
量子位-量子位官方账号-2020-03-23 13:18
乾明 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
2項全新能力,4大重磅升級,35個高精度預訓練模型上線,15個產業實踐中廣泛應用的視覺算法加持……
這就是最強國產開源深度學習框架——飛槳的最新重要升級。
在近日飛槳官宣的一系列新模型、新能力中:
不僅有對主流模型的能力提升,比如大幅增強YOLOv3——訓練提速40%,推理提速21%,精度提升4.3%;
還納入最新的SOTA模型,比如基於COCO數據集的精度最高開源模型CBNet;
並上線了用於3D點雲分類、分割和檢測的PointNet++和PointRCNN模型,使其成為國內首家支持3D圖像深度學習的開源平台;
相應地,這些模型的開發、壓縮、部署的“一條龍服務”也升級到全新版本,比如目標檢測模型,使用蒸餾+裁剪模型壓縮方案,基於COCO數據集進行測試,可以加速2.3倍。
更關鍵的是,像這樣的全新發布與重大升級,飛槳一口氣放出了6項,涉及15種算法和35個預訓練模型,全部聚焦於視覺能力。毫不誇張地説,經此升級,飛槳在視覺領域的能力又出現一次大跨越。
而此時,距離飛槳上一次大升級只過了4個月左右。
如此密集的迭代升級為哪般?
結合之前工業化大生產、智能化產業升級,以及新基建蓄力,不難看出飛槳所指,不止於前沿技術突破,更在於產業應用和落地。
而且看過細節後,更讓人深覺“拳拳到肉”。在百度自研AI芯片加持下,飛槳的新算法、新模型和新能力,也正通過智能雲被輸送到各種類型的流水線上。
具體細節,我們庖丁解牛,一點點看。
從強化到新增,視覺模型庫升級
這次飛槳升級的核心是視覺能力。最直接的變化,發生在飛槳的基礎模型庫PaddleCV(智能視覺)中。
首先是PaddleCV能力範圍進一步擴大。新版本的PaddleCV中,新增用於3D點雲分類、分割和檢測的PointNet++和PointRCNN模型。
和此前PaddleCV支持的數十種模型一樣,基於飛槳框架,開發者無需全新開發代碼,只要進行少量修改,就能快速在工業領域實現3D圖像的分類、語義分割和目標檢測任務。
而且模型精度也有保證。飛槳框架中,PointNet++在Indoor3D數據上分割精度(MSG)為86.6%;ModelNet40數據集上分類精度(MSG)達90%——直追SOTA。

**△**PointNet++中多級點集特徵學習的實現。
借鑑了PointNet++和RCNN的思想的PointRCNN,作為業內領先的3D目標檢測模型,在飛槳上實現,精度同樣能夠比肩SOTA。他們給出的實驗結果是:在自動駕駛權威數據集 KITTI(Car)的Easy數據子集上,精度達86.66%。
其次,PaddleCV進一步將各個領域新出現的強大模型納入進來。
比如在目標檢測領域,新增了基於COCO數據集的精度最高開源模型CBNet、Libra-RCNN模型的(精度提升了2%),以及Open Images V5目標檢測比賽最佳單模型。
飛槳還新增了IoU損失函數類型Generalized-IoU和Distance-IoU損失函數,在不增加預測耗時的情況下,模型精度再提升1%。
在圖像語義分割方面,新增了對高分辨率模型HRNet、實時語義分割模型Fast-SCNN的支持。在目標追蹤領域,新增了SiamFC、ATOM等算法模型。
**△**Fast-SCNN網絡結構圖。
但飛槳開發團隊也並非“只聽新人笑”,除了納入更多模型,此前已經支持的主流模型,也在飛槳的升級中得到優化。
比如YOLOv3,在這次升級中大幅增強,精度提升4.3%,訓練提速40%,推理提速21%;人臉檢測模型BlazeFace,新增了NAS版本,體積壓縮3倍,推理速度提速122%等等。
飛槳透露,這次新增產業實踐中廣泛應用的算法15個、35個高精度預訓練模型之後,PaddleCV庫中的高質量算法已經達到73個,預訓練模型總數達到203個。
而且這些,還只是飛槳這次升級的一部分而已。
模型開發、壓縮、部署“一條龍服務”增強
想要打造一個能夠落地到場景中的AI應用,不僅要開發訓/練模型,部署到應用場景中也是關鍵。
而在部署模型的過程中,還要針對部署的設備,調整壓縮訓練開發好的模型,使其能適應場景,且不喪失原有的精度。
圍繞這方面的需求,飛槳同樣強化了能力,最核心的提升在於模型壓縮工具PaddleSlim、移動端部署框架Paddle Lite。
在過去一年中,PaddleSlim歷經四個版本打磨,現在迎來了1.0版本——囊括了深度學習模型壓縮中常用的量化、剪裁、蒸餾、模型結構搜索、模型硬件搜索等方法。
應用到百度人臉SDK中,它能夠實現在嵌入式設備上,0.3秒內完成人臉檢測、跟蹤、活體檢測、識別等全流程操作。
而這不過是它這次升級後的新特性之一。這樣的特性,PaddleSlim1.0一共有10個。
比如,其針對YOLO系列模型開發的蒸餾方案,實現COCO任務的精度提高2%;使用裁剪模型壓縮方案時,它能夠大幅降低算力需求。在圖像分割模型上,應用PaddleSlim1.0的壓縮部署方案,FlOPS(算力)能減少51%。
而且,PaddleSlim1.0還開放了更加靈活的NAS API,預定義了更豐富的搜索策略和搜索空間。對比單卡SA搜索策略,單卡One-Shot策略實現搜索速度加快10倍以上等等。
PaddleSlim的這些特性,與最新版本的Paddle Lite結合,也進一步提升了飛槳的能力——將功能強大的深度神經網絡部署到移動嵌入式設備端上。
此外,飛槳還新推出了大規模分佈式訓練工具PLSC,具備了千萬規模分類的能力。據悉,PLSC能自動將全連接層參數切分到多GPU卡,可以將單機8張V100 GPU配置下支持的最大分類類別數擴大2.52倍。
而且訓練精度和效率高:多個數據集上可以取得SOTA的訓練精度,同時支持混合精度訓練,單機8張V100 GPU配置下,混合精度訓練速度提升42%。
**△**開啓PLSC混合精度訓練方法。
更關鍵的是易用性。飛槳介紹稱,只需要五行代碼,在飛槳上就可實現千萬類別分類網絡的構建和訓練,提供大規模分類任務從訓練到部署的全流程解決方案。
可能也正是因為易用、不斷豐富的能力,飛槳的生態也正在進一步完善。截止2019年,飛槳的開發者數量已經超過150萬,是國內最大的AI開發者生態。
他們在將飛槳帶到更多應用場景中的同時,也在為飛槳能力提升提供更多的幫助。
飛槳為什麼能夠實現快速發展,領銜中國深度學習平台市場(來自IDC數據)?他們功不可沒。
此外,飛槳支持的硬件,尤其是國產芯片,也在進一步增多。據悉,繼華為麒麟芯片之後,比特大陸最新算豐系列AI芯片也已經與百度飛槳深度學習平台的成功融合。
密集升級背後,為工業化大生產提供彈藥庫
模型庫愈發充足,端到端開發部署一條龍服務再度強化,飛槳的目標變得愈發清晰——工業化大生產。
這也是百度AI的目標所向,在過去的一年中,李彥宏、王海峯多次對外明晰:AI技術已經進入工業大生產階段,智能雲作為載體,能夠促進AI落地,加快產業智能化進程。
百度在如何推進這一戰略?不斷迎來密集升級的飛槳,就是他們打造的武器,在百度自研芯片的支撐下,正通過百度智能雲輸送到工業生產“前線”。
最新範例已經出現。3月15日,百度與微億智造打造的工業智能質檢設備,正式部署上線,雙方合作構建完成了一個從智能硬件到算法軟件再到算力供給的智能製造解決方案大閉環,實現算力2倍提升。
這背後,不僅僅有飛槳深度學習平台的支持,還有百度智能雲、百度崑崙芯片支撐——這也是中國自研 AI芯片在工業領域的首次大規模應用。
而且, 不僅僅是智能質檢等工業方面的落地部署,在這次抗疫中,基於飛槳、智能雲、崑崙芯片的百度軟硬一體化AI能力,也展現出了能力。
在2月10日的《新聞聯播》中,出現了這樣一則案例:
江蘇常州的精研科技,藉助百度與微億智造聯合打造的智能自動化監測設備“表面缺陷視覺檢測設備”,解決了工人無法復工情況下的生產難題,十台無人值守的智能化檢測設備24小時工作,比人工檢測效率提升近10倍。
近來大環境、大趨勢,疫情衝擊之下,全球經濟整體出現了不小的負面影響。但危中帶機——最大的機會莫過於轟鳴陣陣的新基建。
何為“新基建”?核心涵蓋,就是以新型智能化為方向的基礎設施建設。而2月10日的《新聞聯播》案例中,百度飛槳充當的,正是新基建需要的工具箱、彈藥庫。
然而,其中案例只是代表性的一例。
就目前而言,抗疫不斷收尾的中國大地上,這樣待升級的傳統產業、等待智能化變革的場景,以及AI發揮價值的降本增效領域,還有很多很多……
飛槳一系列升級,或許只是春江水暖,但也可能是躊躇滿志多年後恰逢其時。
總之,飛槳的新基建彈藥庫,現在已經準備好了。如果你是想抓住時代機遇的開發者,機會可別錯過了。
最後,飛槳PaddleCV這次的升級詳情,傳送門如下:https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV