谷歌街景可以揭示你所在社區的很多信息 - 彭博社
Linda Poon
這張布魯克林社區的圖片中的汽車可以揭示出很多關於那裏的居民的信息。谷歌街景如果你在城市中走動,看到路邊停着的皮卡車比轎車多,那麼大多數居民很可能投票給共和黨。這聽起來像是另一個刻板印象——共和黨人開着皮卡,而民主黨人則更喜歡豐田普鋭斯。但也許這其中確實有一些真相。
這就是斯坦福大學的一組人工智能研究人員通過僅僅基於谷歌街景汽車圖像來預測人口統計和投票模式所發現的。
彭博社城市實驗室土耳其計劃在伊斯坦布爾增加出租車以應對投訴代際住房可以幫助老年人對抗孤獨倫敦的奧運遺產如何重塑被遺忘的東區隨着農村醫院關閉產科病房,城市醫院也在跟隨研究人員利用來自200多個城市的約5000萬張街景圖像,開發了兩個算法。一個算法檢測並將汽車分類為2600多種不同類別,基於品牌、型號、車身類型和年齡等因素。(考慮到許多圖像模糊不清,這真是一個了不起的成就。)然後,利用來自人口普查和2008年選舉的數據,他們訓練了另一個算法,以根據存在的汽車預測不同區域和選區的收入水平、種族構成、教育程度和投票模式。
在這些發現中:豐田和本田汽車與亞洲社區有很強的相關性,這與調查結果一致,這些調查表明亞裔車主更喜歡亞洲品牌而非美國品牌。同時,黑人社區與別克、老斯莫比爾和克萊斯勒汽車的關聯更強。皮卡車、大眾汽車和阿斯頓·馬丁的存在則表明主要是白人社區。
當研究人員將美國的預測人口地圖與人口普查數據進行比較時,他們發現他們的估計出奇地準確。PNAS這肯定不是完美的。“它可能永遠不會是100% [準確],”研究人員之一的喬納森·克勞斯説。但當他和他的團隊將他們模型的預測與美國社區調查的實際數據進行比較時,他們的估計並沒有偏差太大。該模型準確地確定華盛頓州西雅圖的白人比例為69%,非裔美國人主要居住在南部社區。同樣,該模型在預測佛羅里達州坦帕最低收入的郵政編碼位於南端時也是正確的。
更令人驚訝的是,甚至對研究人員自己來説,皮卡車與轎車在一個選區(約1000名居民的區域)中的比例準確地決定了居民的政治傾向是民主黨還是共和黨。在亞利桑那州的吉爾伯特,該模型正確識別了60個選區中58個的投票模式,準確率為97%。總體而言,該模型表明,擁有更多轎車的城市在下一次選舉中投票支持民主黨的概率為88%,而擁有更多皮卡車的城市則更有82%的可能性投票支持共和黨。
不過,克勞斯説,這並不是為了驗證刻板印象。“我們並不是在談論個體層面,所以並不是説你開一輛皮卡車,因此你就是共和黨人,”他告訴CityLab。“這些研究是基於對整個選區甚至更高層次的聚合。”更重要的是,他強調,這些並不是因果關係:“更確切地説,我們看到這些事情是同時發生的。”
此外,考慮到幾個縣在去年的選舉中 翻轉 了他們的支持,團隊無法確定如果使用更近期的街景圖像和2016年的投票數據,結果會是什麼樣子。(本研究中使用的街景圖像來自2013年。)
研究人員將他們預測的投票模式地圖與2008年人們實際投票的地圖進行了比較。在(B)下,左側的地圖顯示了實際投票模式,右側的地圖顯示了預測的投票模式。PNAS像這樣的機器學習的使用對大規模調查來説是一個潛在的遊戲規則改變者,儘管這並不是沒有風險——這一點可以通過前華爾街分析師凱西·奧尼爾在她的書中最好的描述 數學毀滅武器:
推動數據經濟的數學驅動應用是基於易犯錯誤的人類所做的選擇。這些選擇無疑是出於良好的意圖。然而,許多模型將人類的偏見、誤解和偏見編碼到越來越多管理我們生活的軟件系統中……而且它們往往懲罰我們社會中的窮人和被壓迫者,同時讓富人更富。
這並沒有被研究團隊和日益增長的人工智能社區忽視。“在這個領域,人們越來越認識到你的算法的偏見程度僅取決於你提供的數據,”克勞斯説。“錯誤的使用我們研究的方法是將其應用於個體層面,這樣做是危險的。”
但它可以幫助像美國社區調查這樣的事情,研究人員指出,進行這項調查每年花費政府超過2.5億美元。克勞斯和他的團隊認為,隨着人工智能技術的進步,它不僅可以減少勞動力和成本,更重要的是,減少時間滯後。
“我認為[這個模型]的準確性還不足以取代手動過程,但如果在收集調查數據之前應用這樣的東西,你可以獲得更及時的信息,儘管它會有些嘈雜,”他説。“也許你可以用這個來找出哪些地區變化很快,或者哪個社區在惡化,”這給政策制定者提供了提前實施正確舉措的機會。
隨着社會的變化(比如,千禧一代停止駕駛或城市終於找到 如何實現無車化)像他的模型可以被訓練來分析其他可能具有指示性的方面,比如建築風格,或種植的樹木類型,甚至可能是行人——儘管他也完全意識到那裏的隱私問題。