餐廳評論揭示了城市的哪些信息 - 彭博社
Linda Poon
托馬斯·彼得/路透社在線評論網站可以告訴你很多關於一個城市餐飲場景的信息,它們也能揭示很多關於這個城市本身的信息。
麻省理工學院的研究人員最近發現,從流行的評論網站收集的關於餐廳的信息可以用來揭示一個社區的多個社會經濟因素,包括其就業率和居住、工作及旅行在那裏的人的人口特徵。
上週在 國家科學院院刊 上發表的一份報告解釋了研究人員如何利用在大眾點評網(中國的一個類似Yelp的網站)上找到的信息,以獲取通常可以從官方政府人口普查中獲得的信息。該模型可能特別有助於收集那些沒有可靠或最新政府數據的城市的信息,尤其是在資源有限、無法定期進行調查的發展中國家。
彭博社城市實驗室納粹碉堡的綠意改造將醜陋的過去變成城市的眼球吸引器聖保羅的貧民窟如何幫助庇護南美洲最大城市僅使用公共交通的跨洲競賽悉尼中央火車站現在成為建築目的地“我們想探索一種新的方式,利用餐廳數據來預測那些非常小的社區級屬性,如收入、人口、就業和消費,而不依賴於官方的人口普查數據,”麻省理工學院未來實驗室的城市發展教授鄭思齊説,他特別關注中國。
存在一個社會經濟數據差距……“即使我們現在處於大數據時代。”鄭和她的同事們使用來自九個不同規模的中國城市的餐廳數據測試了他們的機器學習模型——從像北京這樣人口超過1000萬的擁擠城市,到像保定這樣人口不到300萬的小城市。
他們從大眾點評上提取了630,000家餐廳的數據,包括每家餐廳的位置、菜單價格、開業日期和顧客評分。然後,他們將這些數據與官方普查數據以及從手機和銀行卡收集的匿名位置和消費數據一起輸入機器學習模型。通過比較這些信息,他們能夠確定餐廳數據在多大程度上反映了他們關於社區特徵的其他數據。
他們發現,當地餐廳的情況可以以95%的準確率預測社區白天和夜晚的人口變化,這些變化是通過手機數據測量的。他們還可以分別以90%和93%的準確率預測商家的數量和消費者消費的總量。提供的菜系類型和可用餐飲場所的種類(例如咖啡館與傳統茶館)也可以預測移民的比例或居民的年齡和收入分佈。對於靠近城市中心的社區,預測的準確性更高,而對於靠近郊區的社區和較小城市,預測的準確性則較低,因為較小城市的社區變化不如大城市那樣廣泛。
根據這項研究,基於一個數據豐富城市的數據運行的模型足夠準確,可以應用於一個國家內的不同城市。
綜合來看,這些預測為城市規劃者提供了最新的社會經濟屬性,以“做出提供公共服務的決策”,鄭説。“他們需要了解需求方。”至於私營部門,關於白天活動的預測將告知他們在哪裏設立零售或房地產市場。
當地餐飲場景能夠描繪出其所在社區的情況是有道理的。“這是最分散和非管制的地方產業之一,尤其是在中國,”鄭告訴CityLab。也就是説,它們幾乎都是私營企業,並且由需求驅動,與其他行業相比,進入門檻較低。此外,餐館隨處可見,並且隨着時間的推移,往往會變化以反映社區的變化。
在這個意義上,鄭和她的團隊認為這種方法可以應用於任何地方,尤其對低收入國家將特別有用。她説,各國之間以及一個國家內的城市之間存在社會經濟數據差距,“即使我們現在處於大數據時代。”
雖然這些在線平台可能沒有以科學的方式收集信息,但其豐富的數量使其成為政府數據的有用補充。例如,在美國,Yelp數據可以反映城市的經濟健康,並揭示食物、種族和城市更新之間的聯繫。
鄭承認該方法的侷限性:首先必須有足夠的餐廳數據輸入機器學習模型,而這在所有國家可能並不可用。但如果僅來自少數城市的數據能夠幫助預測一個國家內所有城市的特徵——例如,中國有600多個城市——那麼小型、資源不足的城市也能受益。也許未來的研究可以測試一個模型,使用僅來自一個國家城市的數據,是否能夠預測全球任何城市的社區特徵。