如何避免被錯誤地圖欺騙 - 彭博社
bloomberg
這張地圖到底是什麼意思?iQoncept / Shutterstock.com地圖在如今非常流行。博客和新聞網站(包括 這個)經常發佈地圖,這些地圖常常會迅速傳播——40張解釋世界的地圖、每個美國州最受歡迎的電視節目等等。它們遍佈於Facebook、Twitter和Tumblr,新聞機構顯然正在利用地圖在數字空間中所具有的強大力量:它們可以快速有效地可視化大量數據。但它們也可能不準確和誤導性地可視化大量數據。
地圖不僅僅是一幅圖像——它也是地圖背後的數據、用於收集和解析這些數據的方法、進行這些工作的人員、在可視化方面所做的選擇以及用於製作它們的軟件。地圖也是對世界的一個表現,在某種程度上,這種表現總是必須有些不準確——畢竟,大多數地圖是在平面上展示大致球形的世界。某些事物總是被省略或突出,而其他事物則被改變,因為沒有任何地圖可以一次性展示所有內容。所有這些選擇和偏見,無論是有意識的還是無意識的,都可能對地圖本身產生重要影響。我們可能在不知情的情況下看到一些不準確、誤導或錯誤的東西。
美國人從小就被教導分析和理解詞語的意義和操控,但他們很少被教導關於地圖的同樣技能。正如馬克·蒙莫尼爾在他那本精彩的書中所寫的如何用地圖撒謊,美國人從小就被教導分析和理解詞語的意義和操控,例如廣告、政治活動、新聞等(正如他所説的,要成為“謹慎的詞語消費者”),但他們很少被教導關於地圖的同樣技能。
彭博社城市實驗室一位藝術家重新想象童年的空間,結果卻充滿荊棘房地產開發商納夫塔利在邁阿密海灘尋找交易,藉助佛羅里達的推動美國的駕駛和擁堵率比以往任何時候都高海牙成為全球首個禁止石油和航空廣告的城市關於使用地圖(以及整體地理)的教育在美國學校中並不全面或普遍。例如,高中人文地理的高級課程考試直到2001年才開始提供,許多頂尖私立大學也不提供地理作為一門學科。哈佛在1948年取消了這門課程,一些學者將其歸咎於全國地理學習的下降。
許多研究報告稱,絕大多數美國人缺乏地理素養,無法在地圖上找到阿富汗或伊拉克等地方,更不用説理解關於它們的更復雜的空間關係——事物在哪裏,為什麼在那裏,這如何影響其他事物?(值得一提的是,哈佛在2006年成立了地理分析中心。)如果他們想到這一點,許多美國人認為地理只是記住州首府的列表或看《國家地理》中的酷動物圖片。
因此,人們常常認為地圖是準確的,這並不奇怪,因為地圖的製作方式往往不清楚——正如Monmonier所説,地圖是“被賦予不當尊重和可信度的神秘圖像”,這些圖像“被委託給一羣技術上合格的設計師和繪圖員”。幾乎每個人都能寫字,但並不是每個人都能製作地圖。
與此同時,隨着計算機和軟件變得更強大且更便宜,地理信息系統(GIS)的使用激增。新的網絡製圖工具和數據的可用性正在使製圖民主化,幾乎任何人都可以嘗試製作地圖——這在以前僅限於專家或專業軟件用户。這意味着更多的人正在創建自己的地圖,這無疑是一件好事,但這也意味着有更多不準確、不正確的地圖存在——要麼是故意設計的(為了傳播病毒或推動某種觀點),要麼是因為創作者並不完全理解他們在做什麼。
地圖仍然很有趣,即使是不準確的地圖。但你可以採取一些步驟,並牢記一些概念,以避免被地圖所欺騙。
不要相信標題
一個好的製圖者應該正確且簡潔地解釋他們的地圖實際展示了什麼,而不是做出誇大的聲明。最近的一個例子是一個 紐約時報 的文章和互動地圖,名為 “成長的最佳和最差地方。” 這似乎是不言自明的,但這張特定地圖背後的數據實際上只顯示人們根據成長地點的不同而賺取的收入多寡。這仍然是一個非常有趣的發現,但賺取更多或更少的錢並不一定意味着一個地方比另一個地方更適合成長,這一點很難定義,並且肯定會涉及許多變量:也許一個地方的生活成本更低,或者學校更好,醫療保健更好,娛樂選擇更多,等等——而 一篇配套文章 實際上提出了這個論點。
紐約時報數據呈現得非常吸引人,令人印象深刻的是,地圖實際上會根據你閲讀的地點而變化,但標題並沒有真正展示它所聲稱的內容。如果你只是看地圖並認為某個地方好或壞,你就錯過了整個故事。亞特蘭大或丹佛是成長的壞地方嗎?最好的地方是懷俄明州、猶他州、達科他州以及農村明尼蘇達州和愛荷華州嗎?這取決於你認為的最好和最壞。
地圖標題上的紅旗詞也應該是類似Upworthy的詞彙,如驚人、不可思議、華麗等等,或者那些聲稱解釋一切的詞——“這張令人驚歎的地圖顯示美國一半的產出是由少數城市產生的,”例如。深入研究數據和地圖製作方式後,那些驚人的説法往往變得相當無聊。
那張顯示國內生產總值(GDP)的特定地圖似乎暗示城市中的人們比農村地區的人們更具生產力,但實際上它顯示的是國家50%的GDP是由50%的人口產生的,因為生活在城市的人遠遠超過生活在農村的人:這根本不是一個驚人的故事。更有趣的地圖應該是按人口劃分的GDP——某些地方是否比其他地方更具生產力?為什麼?(我喜歡告訴我的學生,一張好的地圖可能提出一個問題,而不是回答一個問題。)一個類似的例子是顯示92%的美國艾滋病病例發生在25個縣的地圖——但另一篇文章指出大多數美國人口生活在這25個縣,所以這可能是意料之中的。更有趣的是繪製縣之間的差異。
與標題相關的一個問題是它們如何解釋地圖,這也説明了為什麼一張好的地圖應該在地圖本身上包含數據來源(稍後會詳細説明)。例如,這張地圖 美國企業州 聲稱顯示每個州“最具識別度”的公司。但“最具識別度”是什麼意思呢?地圖的作者值得稱讚地解釋説,這只是他認為最能代表該州的公司,而不是基於實際數據的東西,比如對某個公司的熟悉程度百分比、市場價值或其他什麼。佛羅里達州 不需要為 這張地圖上代表它的Hooters感到羞愧。例如,另一張關於某州最具特色樂隊(即在其他州更受歡迎的樂隊)的熱門地圖,背後有實際數據,被分享為 “你州的最愛樂隊”——這是兩回事。
這些“驚人的”地圖往往只是某人編造的。當然,這並不意味着它們不能看起來好看和有趣。(事實上,它們應該看起來好看。不要分享醜陋的地圖。)
來源很重要
地圖上數據的來源是你應該首先尋找的東西之一——這些信息來自哪裏?這是一個可信的來源嗎?是最新的嗎?你能自己查看嗎?
如果來源沒有列出,請保持懷疑——即使它列出了也要保持懷疑。例如,在最近一張關於 最被討厭的大學籃球隊 的病毒式地圖中,製圖者包括了一些元數據,列出自己為創作者,這很有幫助。然而,數據本身來自於一項在Reddit的大學籃球板塊上發佈的兩題Google Docs調查,幾乎不是一個具有代表性的美國人羣體。調查確實要求受訪者輸入他們來自哪裏,但人們可以故意説錯——一個不喜歡杜克大學的人可以説他們來自北卡羅來納州,以扭曲數據。
在這種情況下,更準確的描述應該是“在自我選擇的Reddit大學籃球板塊用户中最被討厭的大學籃球隊”——這種解釋應該出現在地圖上,而不是讓讀者自己去尋找。再説,這可能也沒有幫助它被 報紙 選中,報紙在那些所謂被討厭的球隊所在的地方出版。
你能相信這張地圖中的數據嗎?仔細看看。來自《花花公子》這是一個愚蠢的、無害的例子(誰在乎大學籃球仇恨地圖是否不準確?)但任何類型的數據——政治、健康、宗教等等——都可能發生同樣的事情。
readily available 的源數據也可以讓你看到某些東西是否存在偏見,甚至只是完全虛構的一個有趣例子是 “他們一直掩蓋的最常見死亡原因” 按州分類,包括像巨魔、俄羅斯入侵、湖怪和乳糖不耐症這樣的東西。這顯然是對顯示州內最受歡迎的電影、工作或食物等內容的病毒地圖的諷刺——或者更嚴肅的主題,如死亡原因——這些都可能是 誤導或被誤解,並且很容易隱藏州之間的差異。
像 “每個州的標誌性食物” 和 “每個州最受歡迎的電視節目”(或者是最重要的節目?標題很重要)也來自Reddit用户,這可能是為什麼像“冰毒餅乾”這樣的東西出現在阿肯色州的標誌性食物中。這些地圖當然很有趣,但基於它們得出結論並不是最好的主意。可以推測,小石城的餐館菜單上沒有很多冰毒。
熱圖和密度圖可能會讓人困惑
這部網絡漫畫 XKCD 以幽默的方式揭示了這種類型,地圖顯示了三種無關事物的密度:訪問網站的人、訂閲 瑪莎·斯圖爾特生活 的人,以及消費毛茸茸色情的人;而這三者的密度是相同的。
XKCD這個笑話在於每張地圖實際上只是一個人口地圖,更多的人往往會做更多的事情。上面提到的GDP地圖實際上也只是一個人口地圖——在有更多人的地方,GDP也更多。
另一個説它 顯示每條推文 的地圖也屬於這一類別:雖然是一張真正美麗的地圖,但它基本上顯示的是人們在更多人聚集的地方發推文,正如偉大網站的地理學家 Floating Sheep 指出的那樣。也許僅僅顯示某個地方有很多東西就足夠了,但如果你試圖繪製除了人口之外的其他東西,或者得出有用的結論,熱圖需要做一些其他的事情,比如按人口或其他有用因素對數據進行概括。
例如,每人推文數量的地圖會很有趣:這樣你就可以看到你所觀察的事物實際上是更常見還是更少見。(製作那張推文地圖的埃裏克·費舍爾有一些其他有趣的例子,比如觀察 遊客與當地人 拍攝地理標記照片的地方,以及一些顯示在不一定有更多人的地區推文更多的地方,比如華盛頓特區的阿納科斯蒂亞河以東。)
製圖師試圖展示什麼?他們試圖隱藏什麼?
地圖是世界的表現,其中某些事物被突出顯示,而某些事物被移除。這通常是件好事:如果有一張特定目的的地圖,它應該只包含有用的東西(例如,公路類型、路圖上的名稱和城市),或者為了清晰起見,你可能會減少某些東西的複雜性,比如地鐵圖上的線條。但很難判斷某些東西是否被操控或移除,因此考慮製圖師可能做出的選擇是很重要的。
一個簡單的例子是那些宣傳或試圖説服你的地圖:那張房地產地圖是否準確顯示了距離?它是否遺漏了附近的煤電廠或臭雞場?(想想 辛普森一家 和 單軌列車——它把布羅克韋、奧格登維爾和北哈弗布魯克標在了地圖上!)
顏色和大小也可以用來突出或隱藏某些東西。如果製圖師想要顯示某樣東西是壞的,他們會把它標成紅色;如果他們想要突出某樣東西,他們可能會把它做得大而鮮豔,而把他們不想讓人注意的東西做得小而灰(或者乾脆把它們去掉)。
如果他們想要顯示某樣東西很多(新澤西州的坑窪,例如)他們可能會把符號做得大而醒目。這些大符號可能會掩蓋數據中的很多變化——這些坑窪是寬一英尺,還是隻有一英寸?新澤西州的坑窪比其他地方多嗎?除了“哇,這裏有很多坑窪”之外,幾乎無法判斷其他信息。(而且地圖也沒有列出數據的來源。)
這也可能是無意的:人們可能會假設某些東西是壞的,如果它是紅色或不同的顏色,即使事實並非如此——而紅色也往往會使人們的視線偏離更微妙的顏色。一個令人困惑的例子是美聯社的一張地圖,顯示了 各州的人口增長:
密歇根州是紅色的,所以這意味着不好,對吧?但是圖例因多種原因而令人困惑。這裏有三種不同類型的範圍:兩個“少於”符號,三個數值範圍如5-10,然後是一個“加”符號。數字顯示的多樣性可能使理解變得困難。而且還有重疊:10%是在5-10範圍內還是10-15範圍內?更有用的範圍可能是0-4.9,5-9.9,等等。少於5%的數據在技術上也包括少於0%的數據。最後,註釋説數據是以千為單位,但隨後列出了百分比。德克薩斯州的人口增加了很多,但並沒有增加20000%。所有這些都很好地説明了為什麼圖例和顏色不應被忽視。如果紅色是壞的,那就明確説明原因。
一個相關的特徵是要注意數據是如何結構化的——它是數據本身的值,例如總失業率或失業率,還是從這些數據中派生的其他東西?你離實際值越遠,就越應該保持懷疑。你是在查看變化率,甚至是變化率的 減少 嗎?如果有人強調第二導數,他們可能會掩蓋整體情況不好的事實。(不過,有一個重要的推論:按人口標準化數據,我們很快會討論到這一點。)
數據分佈的方式很重要
如果一張地圖使用不同的顏色顯示某種事物的變化,比如按州劃分的人口,其中淺色表示較少,深色表示較多(這被稱為分級地圖),請特別注意將值安排成不同類別的方式。這種分佈可能會誤導或掩蓋現實。
通常,製作一張將數據分為相等區間的地圖是正常的——按縣劃分的人口從1-10,000,10,001-20,000,20,001-30,000,等等。然而,有時這種邏輯組織並不是呈現信息的最佳方式。如果製圖者想要突出或隱藏某些內容,操縱類別分界線(這些分組之間的分隔線)就很容易,將所有高值或低值放入一個大類,同時將其他值分成各自的類別。通過這種方式,你強調了數據的一部分,同時隱藏了另一部分。一個很好的例子是這些佛羅里達州西班牙裔人口的地圖:


雖然它們都使用完全相同的數據,但每張地圖中不同的類別選擇使得西班牙裔人口的數量看起來差異巨大。
如果地圖沒有實際説明這些劃分是什麼,比如僅僅包含“高”和“低”的顏色,或者完全省略圖例,那麼要非常懷疑。這是另一個警告,表明來源可能不可信,或者只是某人編造的東西。
數據的分組也可以是任意的:如果製圖者想要突出他們認為是積極的事情,比如失業率的下降,他們可能會製作一張顯示失業率下降的縣的地圖,以及下降了多少的程度,使用深色漸變來顯示下降的幅度,而失業率上升的縣則都使用相同的不顯眼的顏色(比如淺灰色)。也許那些地方的失業率上升實際上比突出顯示的下降要大得多,從地圖上你無法得知這一點。顯示相同數據的地圖,如果包含上升和下降的比例,會讓讀者對數據有很不同的理解。(這又是數據來源重要的另一個原因。)
分級圖可能很棘手
我之前提到的分級圖可以非常有效地展示數據,但如果使用不當,可能會導致很多問題。其中之一被稱為“可修改區域單元問題”,這是因為州、縣、人口普查區等的大小或人口並不均勻,且人口在其中的分佈也不均勻。這意味着現實世界中的聚集或模式可能會被用於劃分數據的邊界所掩蓋。你可能需要深入挖掘數據以理解這些模式。
這 系列分級圖 顯示了2012年美國總統選舉的這個問題。第一張地圖讓人覺得總統競選相當接近,或者國家非常分裂(紅州與藍州)。然而,根據誰贏得選舉將一個州塗成紅色或藍色,會掩蓋勝利的邊際、總票數以及該州內部的任何變化。
如果製圖師選擇更細緻地按縣顯示相同的數據,這是一個合乎邏輯的選擇,似乎羅姆尼的支持率遠高於奧巴馬,儘管奧巴馬獲得了多500萬票,並輕鬆贏得了選舉人團的投票。我們知道這一點是因為每個縣的人口並不相同——奧巴馬在小型城市縣中以壓倒性優勢獲勝,這些縣的人口非常龐大,而羅姆尼則贏得了許多人口稀少的農村縣。即使你按支持程度顯示數據,從藍色到紫色再到紅色(選舉後流行的“紫州”地圖),你仍然會錯過城市縣通常面積很小但人口卻很大的事實。
可修改的區域單位問題也是為什麼映射像密度(比如人口密度)而不是原始數字會很有幫助,因為小縣或普查區可能非常密集。
解決這個問題的一種方法是 一個卡託圖,這是一個圖形,其中的區域單位(在這種情況下是縣)根據其人口大小進行調整,因此人口更多的縣看起來會大得多。
這在某種程度上是有幫助的,但即使我們已經知道那些州或縣是什麼,也可能會相當混淆或迷失方向。添加顯示每個縣勝利邊際的顏色漸變會更有幫助:
該氣候圖顯示,大多數人口眾多的縣 overwhelmingly 支持奧巴馬,而其餘的縣大多是紫色的。
這一切可能看起來顯而易見,但那是因為我們通常熟悉美國的選舉結果。我們不太熟悉的信息可能會顯示出不存在的模式或基於展示或組織方式的錯誤模式。這就是為什麼製圖師需要理解他們的數據和他們所繪製的內容的重要性,以及為什麼數據應該是可用的,以便其他人可以進行查閲。
一個糟糕的理解例子是 FiveThirtyEight 關於 尼日利亞綁架事件 的一篇現在已更新的文章。最初,作者在沒有充分理解數據是如何收集和組織的情況下繪製了綁架報告的數據,並從中得出了許多錯誤的結論,導致了一次漫長的撤回。例如,未被映射到尼日利亞特定城鎮的數據被放置在該國的正中心,因此一個分區圖使得該中心點所在的地區看起來發生了大規模的綁架潮。此外,文章聲稱這是綁架地圖,而實際上這是一張 綁架報告 的地圖,這是一個微妙但重要的區別,也是為什麼準確的標題和描述很重要的另一個例子。
基礎數據也很重要
即使是用於地圖的基礎數據也可能產生重要後果——邊界、位置等等。例如,谷歌地圖根據你所在的位置改變邊界:中國、印度和巴基斯坦的邊界在每個國家中都大相徑庭,因為每個國家的土地主張相互衝突。該公司對 克里米亞 在烏克蘭、俄羅斯和世界其他地方也做了同樣的事情,微妙地適應(甚至改變)這些國家人們的認知。你可能沒有意識到有什麼不對,因為你一直以同樣的方式看待它,而其他地方的人可能一生都看過不同的地圖。
地圖的展示方式也可能很重要。臭名昭著的墨卡託投影就是一個顯著的例子,它誇大了歐洲和北美的大小,同時使非洲和南美看起來比實際要小得多。一個有趣的例子來自於白宮風雲。
基礎數據也可能存在系統性缺陷:關於“美國的每條河流”的病毒地圖看起來很美,但如果你仔細觀察,數據存在一些問題。
首先,在德克薩斯州和俄克拉荷馬州有一些直線和矩形區域,河流的密度發生了變化——這顯然不是自然特徵,而是數據中的一個偽影,原因不明的情況下,某些區域的河流被繪製得比其他區域多。地圖上使用的基礎數據可能還有其他類似的缺陷,初看時並不明顯。
但地圖仍然是好的
這一切並不意味着所有地圖都是壞的,或者我們應該總是對它們保持懷疑,或者只有專家才能製作地圖。地圖本身就是有趣和好玩的(地理也是!),但稍微多一點思考和對它們如何操控或模糊信息的意識也是一件好事。就像廣告和政治活動一樣,我們不應該天生就信任地圖(或其背後的數據),但它們仍然可以是強大、有趣和令人愉快的。
*更正: 本文最初錯誤地陳述了人文地理高級 Placement 考試開始的年份。考試首次提供於 2001 年,而不是 2010 年。此外,描述美聯社人口變化地圖圖例問題的段落已更新以提高清晰度。
頂部圖像:iQoncept / Shutterstock.com