圖片識別準確率哪家強?微軟完勝各路對手

(編譯:Newsboy)在第九屆年度ImageNet圖片識別競賽中,微軟研究院開發的系統在多個類別評比中獲得了第一名。ImageNet是計算機視覺系統識別項目,是目前世界上圖像識別最大的數據庫。根據評比結果,微軟在圖片識別系統的表現要好於谷歌、英特爾和高通以及其他創業公司和學術實驗室的系統。
微軟研究院所獲勝的系統名為“針對圖像識別的深度誤差學習”(Deep Residual Learning for Image Recognition)。這項研究之所以獲得認可,部分原因是因為其複雜性。
“我們使用了超過150個層深度來訓練神經網絡。”該團隊在項目描述中寫道,“我們提出了一種深度誤差學習框架,它能夠方便對極度深度網絡做優化和整合。當神經網絡相比之前大幅加深時,我們的深度誤差系統準確率就會增加,而其他很多普通網絡在遇到深度提升時,是無法達到這種準確率的。”
事實上,科技公司目前都對該領域的研究表現出了濃厚的興趣,它們希望藉助此類研究來提升它們的內部系統以及消費類產品。深度學習是高性能網絡的核心,從廣義來講,深度學習涉及了在大數據(比如照片)基礎之上對人工神經網絡的訓練,然後再給它們展示新數據,做出推定。
微軟依靠類似技術已經展示了其在該領域的能力,比如“猜年齡”應用和“鬍鬚PK”應用。此外,這家公司還通過微軟研究院的“Project Oxford”項目來對圖像識別技術做商業化運營。
ImageNet大賽要求參賽項目需要從圖片分享應用Flick和不同搜索引擎中10萬張圖片中進行準確定位,然後在儘可能避免出錯的情況下將它們歸於1000個物體分類中,比如iPod,玩具店,清真寺等等。微軟獲勝系統獲得的分類錯誤率為3.5%,定位錯誤率為9%。在過去幾年時間,谷歌以及創業公司Clarifai和NEC在圖片分類領域佔據優勢。
今年,微軟獲勝系統還在ImageNet的物體偵測比賽中獲得了第一名。 “我們甚至未曾相信,這種單一的想法居然能夠取得如此大的成就。”微軟在其博客中寫道。
需要説明的是,中國公司百度並沒有參與今年的測試評比。去年這家公司在測試中曾多次提交數據,使用了不正當手段,後來百度對此事件作出道歉,並解除當時項目小組負責人的職務。
在這次比賽中,IBM在SoftLayer公共雲中為參賽團隊提供了英偉達圖形處理器,供他們使用。