數據挖掘城市的視覺身份 - 彭博社
bloomberg
C. Doersch 等巴黎看起來就像,嗯,巴黎,和地球上其他地方完全不同,這也是法國首都魅力的很大一部分。作為遊客,你甚至不需要參觀埃菲爾鐵塔就知道你已經來到了光之城。在任何住宅區的小巷中漫步,這座城市有着獨特的外觀和感覺,這源於從巴黎陽台的構造到城市街燈風格的無數小區別。
當面對巴黎的隨機圖像時,去過那裏的人在識別這個地方方面出奇地準確(與巴塞羅那等其他地方相比)。一個來自卡內基梅隆大學和巴黎的INRIA/高等師範學校的有趣的研究項目正是嘗試了這一點。研究人員向受試者展示了一些巴黎的圖像樣本,以及來自世界其他11個城市的誘餌圖像。受試者正確識別巴黎的概率為79%。 (你可以在這裏玩這個遊戲。)
彭博社城市實驗室解鎖區域規劃的隱藏力量,無論好壞美國地方選舉官員面臨的威脅正在上升,更多的工作人員選擇辭職倫敦的超富人逃離税收上升的威脅貝爾法斯特的中央車站為北愛爾蘭的公共交通開創了新時代“這表明人們對視覺環境中地理信息特徵的敏感性非常高,”研究人員寫道。“但這些特徵是什麼?”
這是一個人們不太擅長的問題:以某種科學準確性識別出是什麼讓巴黎看起來像巴黎。但研究人員懷疑計算機可能能夠做到這一點。如今的計算機科學家正在對一切進行數據挖掘:推文中的語言、龐大數據集中的數字統計、Foursquare簽到中的地理位置。然而,訓練軟件進行視覺信息的數據挖掘則要複雜一些。
任何一張街景照片都包含數百個獨立元素(單獨的門口、街道標誌、路緣高度、建築細節)。其中只有少數幾個真正反映了一個城市的獨特指紋。在巴黎的情況下,一些顯而易見的選擇是那些嵌在建築側面的著名街道標誌、鑄鐵陽台和裝飾性路燈。研究人員想看看他們是否可以使用算法自動(並更準確地)識別這些地理特徵。
他們尋找的不是像埃菲爾鐵塔這樣的大型顯著地標,而是“日常城市生活的視覺細節。”這些是建築設計和街道生活中較小特徵的模式,這些模式在整個城市中反覆出現——但同時又與其他城市的模式微妙不同。
大量的視覺數據挖掘工作已經在Flickr上完成,但這些圖像嚴重偏向於著名地標。相反,研究人員從Google街景中提取了大約10,000張巴黎及其他11個比較城市的圖像(作為額外的好處,所有這些圖像都是從Google街景車的同一視角拍攝的,這使得比較街景和建築立面在不同社區和城市之間變得更加容易)。所有這些圖像產生了數千萬個獨立的“補丁”,如上所示。
接下來,我們將讓研究人員解釋他們如何訓練算法以聚焦於最具代表性的特徵:
算法在提煉巴黎的視覺身份方面表現得相當不錯。左側是從Google街景隨機捕捉到的城市圖像。右側的補丁代表算法找到的城市的頂級視覺元素。
類似地,這裏是波士頓的比較:
還有舊金山:
研究人員指出,他們的算法在美國城市的表現要困難得多,其中一些最常被識別的元素是汽車品牌和道路特徵。“這可能是由於美國城市在風格和獨特性上的相對缺乏一致性(其風格和影響的熔爐),”他們寫道,“以及汽車在美國街道上的至高無上的統治。”
他們的最終目標是“為一個地方的視覺體驗提供一個風格敍事,”這樣的敍事可以在社區層面、城市層面,甚至區域層面進行講述。在最廣泛的層面上,這種技術可以幫助識別不同文化和地區如何相互影響。你可以,或許,通過觀察沿途的陽台和門道,追蹤奧斯曼帝國在東歐、中東和北非的歷史足跡。如果有人對在這個方向上推進這項研究感興趣,作者甚至提供了一個他們所創造的新領域的建議名稱:“計算地文化建模。”