推特900贊:開源AI畫出超準街道地圖,全球適用,刷新DeepGlobe最好成績_風聞
量子位-量子位官方账号-2019-08-04 14:53
栗子 發自 麥蒿寺
量子位 報道 | 公眾號 QbitAI
這個星球上,還有很多地方沒有地圖。
即便是已經有地圖,也會有很多道路沒標出來。
光靠人類的話,這項任務還是太費時費力,要是AI能幫忙就好了。
於是,出現了名叫Map With AI的應用,用深度學習分析衞星圖像,標出道路 (也能標出建築) 。
**△**粉紅色的就是AI標註
有了它,人類不用手動畫出道路的走向,只要點一下AI標出的路,確認它真是一條路就夠了。
應用來自Facebook,團隊已經用它填補了泰國超過30萬英里缺失的路。泰國全境一共60萬英里路,便這樣標註完整了:
視頻連接請戳https://mp.weixin.qq.com/s/NREmqVYXo6hWsIvzcnwIDA
研究人員説,原本需要三五年的事,這次只花了一年半。
LeCun大佬把這個成果發上推特,已有近千人讚許:
那麼,道路標註完整很重要麼?
舉個例子,發生災害的時候,地圖缺失道路會嚴重影響救援工作。所以,還是標註完整的好。
比如,去年印度喀拉拉邦遇上洪水,幾百萬人受災。Facebook收到求助消息,幾天內在災區地圖上增加了大約21500條路,幫助救災。
不止對泰國和印度有用,團隊用弱監督方法訓練的AI,在世界各地不同的道路網絡上有效泛化。
團隊説,這AI有足以商業化的精確度,不過編輯器的代碼是開源的。
先來觀察一下技術原理吧。
嘈雜的,才是世界的
介紹一點點前情:
2004年,世界上誕生了叫做OpenStreetMap (開放街道地圖) 的地圖協作計劃,簡稱OSM,內容是開放的,人人皆可編輯。
2013年,又有了名叫“iD”的地圖編輯器,人類可以用它在地圖上標出橋樑和街道。這個工具成了OSM的默認編輯器。
Facebook便是在iD的基礎上,用深度學習孕育了RapiD,一個新的編輯器。
編輯器背後的神經網絡,叫做DLinkNet-34,有34層。
訓練用的數據十分龐大,是用航天技術公司Maxar提供的、全球各地的衞星圖像加工而來。
要讓神經網絡適應各地的道路差異,加工方法非常關鍵。
其實,泰國項目得出的地圖非常完整,又有領域專家把關,Facebook對泰國地圖數據十分自信。但用這些數據訓練的模型,卻在其他地區泛化很差。於是,團隊才想了新方法:
藉助OSM (開放街道地圖) 系統裏現有的數據,篩選出數據準確、數據充足的區域。
具體方法是,把地圖分割成2048×2048大小的圖塊,每個像素大約代表實際土地的60公分;然後,把道路標註少於25條的圖塊都過濾掉。
為了和CVPR 2018舉辦的DeepGlobe地圖比賽數據集保持一致,團隊把餘下的圖塊又截成了1024×1024大小。
最終得到180萬個圖塊,覆蓋六大洲****70萬平方英里 (約180萬平方公里) 土地。相比之下,DeepGlobe數據集只有630平方英里,千分之一不到。
這樣一來,就不會像DeepGlobe比賽數據集那樣,只包含印度、印尼和泰國這少數幾個地區,也不會嚴重偏向某種特定的地區發展水平。
選出可用的圖塊後,要把OSM裏的道路向量柵格化 (Rasterize) 到5像素,生成分割掩碼 (Segmentation Masks) ,就是嘈雜的標籤。
注意,這和常規操作並不一樣,一般的語義分割需要完美的標籤;可這世上的道路千奇百怪,寬窄不一,形狀各異,太完美的標籤不易於泛化,嘈雜反而會有優勢。
實驗證明,只用嘈雜的標籤,它就可以和DeepGlobe的其他選手起鼓相當。再加一點微調,就成了道路提取的State-of-the-Art。
最重要的是,它在全球範圍內泛化得很好,不至於走出泰國便一臉矇蔽。
為什麼還需要人類?
就像開頭説的那樣,粉紅色是AI識別的道路。
而粉紅色的不同亮度,代表識別的置信度。
既有置信度,就是説AI標註的結果也不一定是正確答案。
有時候,它還是可能認錯:比如河牀,比如狹長的海灘,比如運河,都是容易混淆的特徵;
另外,路與路之間的連接點,也有可能會被忽略。
於是,團隊開源了RapiD編輯器。AI已經給出粉紅色的街道標註,只要點一下,人類就可以確認那是一條路:

對比之下,它的前輩iD編輯器,每一條路都需要手動畫:
有了RapiD,速度可以加快許多。
其實,RapiD是iD的一個擴展,而iD又是OSM默認的編輯器。
所以,RapiD的編輯結果,可以輕鬆和OSM現有的數據庫結合並起來:
有個Conflation功能,提供瞭如何把新增道路和已有數據結合的建議,也能避免新路把老路抹掉。
**△**左是AI標註,右是與現有數據結合
人機合作,十分美好。
One More Thing
如今,不止泰國的街道地圖完整了,印尼的路也補全到了90%。
除此之外,AI生成的阿富汗、孟加拉國、印度尼西亞、墨西哥、尼日利亞、坦桑尼亞和烏干達街道地圖,都可以在OSM上找到。
這些數據非常寶貴,對各個國家的災難響應,社區規劃,地區經濟等等,可能都會有些幫助。
最後一句,有瀏覽器就可以試玩,據説會有City Skylines的感覺呢。
論文傳送門:https://research.fb.com/publications/building-high-resolution-maps-for-humanitarian-aid-and-development-with-weakly-and-semi-supervised-learning/
GitHub傳送門:https://github.com/facebookincubator/RapiD
博客傳送門:https://ai.facebook.com/blog/mapping-roads-through-deep-learning-and-weakly-supervised-training/
試玩傳送門:https://mapwith.ai/