AI進入深蘭的冠軍時間：CVPR對於木薯疾病分類的關注意味着什麼？_風聞

脑极体-脑极体官方账号-从技术协同到产业革命，从智能密钥到已知尽头2019-06-22 17:00

2019-06-22

幾天前，世界頂級的計算機視覺會議CVPR2019舉辦了FGVC（細粒度圖像分類）系列挑戰賽。和每一場學術會議的競賽一樣，FGVC也成為了中國與世界的競技場。這次FGVC系列挑戰中，深蘭科技所取得的一項成績引起了我們的注意。

一片木薯葉和圖像識別的落地故事

在Cassava Disease Classification這一挑戰賽中，來自中國的深蘭科技DeepBlueAI獲得了第一名。Cassava Disease Classification即是“木薯疾病分類”，挑戰者需要通過不同狀態木薯葉子的照片，來判斷木薯的健康狀態以及患了哪種疾病。

而這一競賽所應用的數據集，來自烏干達農民自己在田地裏拍攝的木薯照片，數據集中的照片來自於不同光線、不同設備以及不同的非專業拍攝者。同時木薯疾病分類挑戰並不像很多挑戰賽那樣給參與者提供了海量數據，其數據集中只有不到一萬張已標註照片和一萬餘張未標註照片。也就是説，木薯疾病分類挑戰是無盡接近於現實需求的。

DeepBlueAI通過圖像增強方法降低過擬合的風險並提高模型的魯棒性，同時利用多個在ImageNet表現優異的模型，以集成方法提升精度，最終獲得了這一分類項目的冠軍。

之所以關注深蘭科技在細粒度圖像分類上的表現，是因為這一問題關係着圖像識別技術的落地發展狀況。

提到圖像識別技術，我們經常能聯想到AI辨識動物、辨識物體等等能力。可實際上這些識別技術大多還都流於大致輪廓而非細節，例如AI可以分辨出貓和狗，卻不一定能夠分別出貓與狗具體的品種。而只有當識別能力不斷細化和深入時，AI才能真正發揮出價值來。這其中最典型的案例就是人臉識別，正因人臉識別在精準度上不斷突破，從一比一到一比N，甚至進化到金融級別，才能應用到更多場景之中。

可相比公開數據集豐富的人臉數據來説，其他領域想要不斷深入細節提升模型精度，會遇到一系列的問題。

最首要的，就是數據集本身不夠豐富。就拿這次木薯疾病分類挑戰來説，木薯這種植物主要被種植於熱帶地區而非農業現代化水平較高的北美、澳洲，也就是説此前很少有相關的數據累積，自然也就很難通過海量數據+暴力計算來建立高精度模型。

伴隨數據匱乏的，是標註成本的高昂。相比人臉標註僅僅需要找到眼睛鼻子嘴巴，細節場景中的標註往往還需要一些專家知識。例如對植物的病變、品種進行分類，很多時候就需要在專家的指導下進行。

最後還有整體產業生態的惡性循環。越是數據匱乏，科技企業參與起來就愈發困難。讓產業的數字化和智能化累積不斷落後，在未來的技術進化進程中不斷的落後。

但好在，CVPR這樣的學術組織正在參與其中改變現狀。就拿FGVC系列挑戰賽來説，所解決的都是貼近現實領域的細粒度圖像分類問題。除了識別木薯疾病以外，還有開花植物科野牡丹科的物種識別、藝術品文化/時期推理、蝴蝶和蛾物種識別等等。

圖像識別之於現實場景的應用性正在不斷擴張和深入，讓人臉識別不再成為唯一的效率工具。底層技術之於現實世界的張力，會越來越大。

從枝頭到根系：深蘭科技的創新循環

要説細粒度的圖像分類如何解決現實場景問題，我們同樣也能從深蘭科技的案例中找到答案。

在深蘭科技的商品識別模型中，不僅需要像一般識別問題那樣檢測出例如蘋果，菠蘿的大分類，同時還需要檢測出具體屬於哪一類蘋果，如富士，煙台等。對農產品有所瞭解的人會知道，很多水果的細分品種之間的差異非常小。例如蘋果中的秦冠和富寒，乍一看都是通紅混圓的，可卻一個口感綿軟一個口感甜脆。想要實現這兩者之間的區分，除了運用整體信息進行大類識別以外，還需要運用上蘋果顏色、斑點甚至果蒂形狀等等局部信息來進行確認。

有了這種識別模型，任何一個不具備農產品知識的人，都可以在不破壞水果的前提下對其品種進行確認，大大提升了人們在選購水果時的效率。

相信看到這裏，大家也能發現，為什麼深蘭科技的DeepBlueAI能夠在木薯疾病分類挑戰中獲得冠軍——“基礎研究+應用開發”一直是深蘭科技的重要標籤。目前深蘭科技的AI技術已經紛紛在智能駕駛、智能機器人、AI city等等九大應用領域之中落地。

深蘭科技的技術工作人員也在採訪中告訴我們，通過AI底層應用的創新，去帶動產品落地、服務民生，滲透到各種日常應用場景，然後在場景中獲得實際數據來反哺AI技術進步，由此形成正向循環。

就像在FGVC系列挑戰賽中，一旦遇到木薯疾病分類這樣極度貼近現實場景問題。擁有大量落地經驗的DeepBlueAI就立刻能找到適應於少樣本、低質量樣本的解決方案。在學術問題的解決過程中，深蘭科技也可以提煉出更多關於AI底層創新的方法論，繼續投入到AI的落地應用之中。於是我們可以看到，圖像識別算法正在高速公路上識別不同車輛的型號、在野外識別不同物種、在零售場景識別商品……這些都與深蘭科技的基礎創新不無關係。

技術領先背後的模式勝利

這一次深蘭科技在FGVC系列挑戰中的勝利，看似是技術能力的勝利，實際上卻是一種AI商業模式的勝利。

深蘭科技CEO曾經強調過，深蘭科技的商業模式是：做強兩端，打通鏈路。所謂做強兩端，既是在自動駕駛、計算機視覺、語音技術等等基礎AI能力上進行創新，同時也在行業應用上不斷深入，將技術與具體場景深入融合去增強服務能力。在這個過程中，硬件、數據、技術能力等等的壁壘被不斷打破，整體產業中資源被打包重組，最終可以交付給用户即拿即用的一體化技術方案。

其實相比之下，深蘭科技的AI商業模式是更為“長鏈化”的。有很多AI創業企業願意去選擇不斷展示技術能力，然後直接出售算法。也有很多AI創業企業，因為掌握了市場資源，直接變身中間商把他人的技術包裝起來售賣給用户。這些商業模式雖然更容易在一時展現出變現能力，卻阻斷了技術不斷創新的道路——技術的創造者向第三方出售算法，就很難見到自己的技術成果在現實應用場景中的表現，也很難進一步對技術做出改進。技術的發展在不斷被分叉、被階段，也就一步步的遠離目的地。

而今天我們所講述的“深蘭模式”，雖然要在算法投入到現實場景中才能獲得商業收益，卻給了技術能力不斷趨向應用生長更新的可能。

相信在CVPR這類學術組織和AI企業的共同努力下，AI的基礎創新會越來越貼近現實應用場景。不分叉、不截斷，在一條筆直的通路中走下去。