林兆楠:價值幾百億美元的美國民調不如賭盤?
guancha
【文/觀察者網專欄作者 林兆楠】
隨着2024年美國兩黨完成令人眼花繚亂的一系列政治作秀,總統大選正在進入最後的衝刺階段。民調作為即時反映候選人當選概率的參考指標,正四年一度地佔據各大新聞版面頭條。不少人都試圖通過民調來證明自己對選舉預測的正確性。
但伴隨着不斷出現的“十月驚奇”,尤其是以色列升級中東戰爭(包括刺殺真主黨領導人、開展南黎地面戰等等),無疑刺激了民主黨左翼選民和穆斯林選民,使得包括密歇根州在內的關鍵戰場州的關鍵少數選民,在選舉日拒絕投票甚至投票支持特朗普的可能性在逐步增大。
這時有人會質疑既然那麼多事件發生了,為什麼民調整體還是顯示哈里斯領先呢?很多人都在引用之前2016、2020年大選民調數據與最終結果有顯著差異這一點來反駁民調的有效性。一些局外人也開始將少數幾份甚至一份的民調結果視作一個不變的參考答案,完全無視民調所反映的包括穆斯林對民主黨支持率下降40%之類的趨勢性變化。
最近有兩件事情更是再次讓民調再次登上熱搜。第一個事情是,全球最大的使用虛擬貨幣的預測市場PolyMarket上,從十月初開始,押注特朗普勝選的籌碼急速增加,這被認為一些聰明資金正在對本次美國總統大選做出真金白銀的判斷。第二件事是,特朗普轉發了博弈公司的選舉賭盤數據以證明自己處於優勢。由於博彩公司的盤口似乎與當時很多民調所顯示的結果相反,這也成為不少人認為歐美民調沒有參考價值的證據。
那麼民調究竟準不準?民調是否有用?要回答這些問題,我們就要回到八年前,那個讓民調揮之不去的夢魘時刻了。
繞不開的“滑鐵盧”
2016年和2020年兩次總統大選預測的連續失誤,是許多人對民調產生“不靠譜”印象的源頭。這兩次大選中,美國的民調都出現了偏差——2016年的民調普遍預測希拉里有70%到80%的勝算,而2020年雖然預測拜登獲勝正確,卻高估了他的優勢。
這其中,無疑以2016年美國總統大選的結果對民調衝擊最大。在八年前那場選戰中,不僅特朗普出乎意料獲勝,其最終得到的支持率甚至與有些民調預測結果的偏差達到十幾個百分點。部分民主黨人以無法接受失敗的姿態發起“通俄門”調查,試圖挽回一些顏面;隨後三年裏,華盛頓政壇陷入一片混亂。

特朗普 資料圖
同時,民調行業的從業者們開始深入探討現實與數據之間的偏差原因。在2020年總統大選中,儘管美國民調機構成功預測了民主黨候選人拜登的勝選,在某種程度上挽回聲譽,但其預測仍存在顯著偏差:93%的民調機構過高估計了拜登的優勢。
兩次連續失誤嚴重損害了民調行業的公信力,甚至就在2020年大選次日,美國知名政治新聞網站“Politico”在其主要欄目中以醒目字體宣稱:“民調產業一團糟,應該被炸掉”。
但是,伴隨民調預測失準的是,美國民調產業幾乎翻倍增長。全美對民調數據的關注不降反升,各個機構的數據依然充斥着媒體頭條。在2022年中期選舉中,就有部分民調機構進一步調整預測方向,認為中期選舉會出現共和黨大勝的“紅潮”。但最後,預期中的“紅潮”並未出現,共和黨只獲得眾議院多數席位,民主黨陣營仍實際控制着參議院。
經過一輪輪的鐘擺,自認已經搞清楚美國選舉狀況的民調產業在2024年摩拳擦掌,想要一雪前恥。更多的吃瓜羣眾也在等着看民調機構的“樂子”。
當然,以上過於簡略的回顧並不能代表民調產業的全部故事。民調的價值遠非“被炸掉的一團糟”所能總結的。最好的例子莫過於之前兩場共三位候選人(拜登、特朗普、哈里斯)參加的大選辯論中,民調數據成為各方評判辯論勝負的焦點。甚至民主黨還依據民調和民眾觀感,直接通過內部協商方式換掉現任總統拜登,讓他不能擔任民主黨的下一任總統候選人。
如果那些將自己的政治生命甚至是自由下注於本次選舉的人都在關注民調,那麼外界觀察者也更不應該將其忽略,以民調為引子瞭解美國的“裏世界”。
預測越失敗民調越發展
從民調產業的歷史看,由於有為選舉提供參考這個硬性需求,每次上一代預測模型出現大問題的時候,民調產業就會迎來一波發展。
美國民調產業的發展歷程始於19世紀20年代,但是早期民調就依賴於單純的問卷調查回訪。改變時代的那一刻發生在1936年,當年為了預測大選結果,《文學文摘》基於向讀者和潛在讀者郵寄的一千萬份問卷,並回收了其中238萬份。由於《文學文摘》曾準確預測過過去五次選舉的獲勝者,所以它在當年的10月31日宣佈蘭登將以57.08%的得票率(對陣羅斯福)和370張選舉人票獲勝。但是它忽略了,《文學文摘》的受眾多是共和黨支持者,這直接導致了預測翻車,1936年,羅斯福贏得了勝利。
而作為競爭對手的喬治·蓋洛普的科學民調卻僅通過幾千份的配額控制調查就準確預測了選舉結果。這一事件展示了抽樣方法的威力,也為如今我們熟悉的民調奠定了基礎。
之後,到了20世紀80年代,民調數據急劇增加。特別是在1984年至2000年之間,民調的數量增加了900%。而在今年大選,美國全國預計將會出現1500份各式民調,令人目不暇接。

根據統計,1998年來,在選舉前21天內的民調在78%的情況下正確預測了勝負(圖中高亮) 網絡截圖
雖然我們現在看到,2016至2020年,乃至2020至2024年大選週期的美國民調並不甚準確,但是如果置於更廣泛的背景中來看,其實整個民調產業在更長週期中,反覆證明了其準確性和存在價值。只是由於我們現在處於美國社會長期積累的多重變化集中爆發的階段,例如2020年民調產業的原有誤差在新冠疫情導的背景下進一步放大,甚至導致短期結果參考價值下降。
從民調機構的角度看來,這樣的“失誤-調整”週期實際上是不可避免,甚至是正常的。畢竟基於民調來預測大選結果的模型,需要通過真實數據不斷校準以獲得準確結果。與普通模型只需要基於統計快速迭代就能取得比較好成果不同,而現有的大選數據量對於美國大選這樣複雜的系統來説無異於杯水車薪。根據一些計算顯示,驗證預測模型的高準確度需要約4000年的選舉數據積累。這意味着現有民調統計中,天然存在大量的無法通過歷史數據校正的部分,只能依賴人的判斷。
而且民調產業天生就是“事後諸葛亮”,無論是哪一種模式來校正,都只能在大選之後完成。因此,民調的重點就在於,能否在這個過程中形成正負反饋,不斷調整迭代民調方法以跟上美國社會的變化。這種調整背後的不確定性也導致一些在2022年中期選舉準確率最低的民調公司在2020年的準確率處於最高一檔。

“Election Poll”這一關鍵詞的谷歌趨勢 Google
隨着網絡時代的到來,民調的失誤顯得尤為刺眼。谷歌趨勢顯示,在2016年11月與2020年11月,美國“大選民調”(Election Poll)這一關鍵詞的搜索量達到了04年以來的兩個高峯。20年的搜索量甚至在16年之上仍有增長,達到了08年與12年的兩倍有餘。
其實,事後分析指出,當時民調的不足之處在事前難以預見。而民調行業也在事後總結經驗教訓,調整和改進了他們的方法。這使得在2022年中期選舉中,雖然一些民調公司嚴重偏離了目標,甚至在媒體上預言會出現紅潮,但總體而言,那次的民調是近年來最準確預測之一。

21-22年的選舉中,在選舉前21天內的民調實現了1998年來的最高準確度 網絡截圖
現代民調的統計學魔法
如今,調查民意的方法可以分為三個步驟:抽樣、調查和計算。其核心是通過統計學方法,對一部分民眾進行調查,以科學地推算出全體民眾的意見。這個“以小見大”的過程就是抽樣,也是現代科學民調的核心。
而且相比於最開始的隨機抽樣調查,由於美國身份政治因素越來越明顯,許多機構已轉向分層抽樣。將調查對象按族裔、居住地、階層等標籤劃分為不同羣體後再進行調查。當然這也導致,如果在劃分或調查過程中有意無意地忽略某些羣體,調查結果會出現顯著偏差。
進入實際調查階段,現代民調主要手段涵蓋了登門訪問、郵寄問卷、電話調查以及互聯網調查。每種方式都有其優缺點:登門訪問更易獲得結果,但可能給受訪者帶來壓力導致回答不準確;電話或郵件調查可能更真實,但其本身也會造成可靠性問題;互聯網調查雖然看似理想,但因完全基於被調查者的自願,可能導致樣本偏差,而且其中不乏用現金獎勵來吸引被調查者的手段更是助長了潛在的偏差。
由於不存在完美的調查手段,民調機構需對收集的原始數據進行加權處理以修正受調查人口樣本偏差,儘可能反映現實,而這就是統計學的魔法時刻了。
理論上説,可靠的修正需民調機構根據人口統計數據、歷史投票行為等因素對原始數據背後的整體情況進行動態加權調整。但是由於美國太大,不同民調機構在加權處理上的策略會根據經驗有所不同。這使得經驗豐富的機構在設計和應用這些模型方面可能會具有顯著優勢,當然如果不能正確調整那現的大眼也將是前所未有的。
在2016年特朗普意外當選後,民調產業回顧了失誤的原因:未完成大學學業的白人中有64%支持他。許多支持者是“鐵鏽帶”的前製造業工人,他們受到特朗普對外貿易強硬態度和對多元價值觀攻擊政策的吸引。
而在2020年大選中,影響民調準確的因素中首當其衝的則是疫情以及特朗普政府糟糕的應對。同時,疫情也導致選民投票途徑較以往更為多樣:郵寄選票或者缺席投票。此外,還有許多對政治抱有興趣的新成年選民在2020年首次投票。這導致了2020年出現了1932年有數據以來美國大選史無前例的高投票率——66.5%,這一投票率相較於上屆上漲6.5%。這使得2020年也出現了40年來最大的民調誤差。
回到當下,民調產業是否有從這兩次錯誤中吸取教訓呢?答案是肯定的。
例如2016年的最大教訓就是需要重視教育水平對一個人投票選擇的影響和調查方法對於結果的影響。自2016年以後,教育水平已然成為各家民調機構關注的重點,其經驗也被推廣開來。現在的民意調查會關注儘可能多的特徵與投票選擇的關係,力求不遺漏關鍵因素。比如蓋洛普和《紐約時報》/錫耶納學院在之後的民調中分別對8個和12個變量進行了調整。
而且考慮到美國糟糕的基礎設施,民調常用郵件、電話之類的手段進行調查。這使得民調在調查集中於鄉村的共和黨選民時出錯的概率遠高於調查集中在城市的民主黨選民。這也導致共和黨的實際支持率被普遍低估的情況時有出現,這使得各家民調機構也在不斷調整抽樣中共和黨支持率的加權。

2000年來美國民調產業飛速整張,調查手段(用不同顏色標註)也更為多樣化 網絡
對比2020年大選,可以説,從2024年大選季開始到現在,並沒有出現與2020年新冠疫情等量齊觀的“核彈級”事件。無論是特朗普遭遇刺殺未遂與民主黨“換將”,充其量是佔領幾天甚至幾周的新聞頭條,強化已下定決心選民的信念。新冠則是數以月計地成為新聞頭條並無時無刻不在提醒着人們要用選票去懲罰那些讓他們親人去世,讓自己面臨斷紙、斷水、斷糧的候選人。
只有足夠的衝擊、足夠的“十月驚奇”才可能讓一個選民重新考慮自己去不去投票,或者是投給誰。從現在看來,短期局部衝擊中唯一與新冠影響可比的事件就是“米爾頓”和“海倫娜”那兩場颶風了。
看最新民調,就找538
對於我們普通人來説,如果要直觀瞭解現在的美國民調,其中的代表就是“538”網站和“真實清晰民調”網站。二者以各自的民調數據彙總算法見長——收集全美各個民調數據並篩選、評級、彙總。其中“538”網站更是在美國學界與業界得到普遍認可,成為各行各業觀察者的重要參考。

截至編輯時,538網站彙總民調數據 網絡截圖
“538”網站的招牌是其對民調機構的排名。這一排名是在彙總全國民調機構的調查之後,通過比對民調機構的數據與現實結果,再結合其在調查方法的透明度,最終對民調機構進行排名。

538網站的民調機構排名 網絡截圖
具體來説,“538”網站會對比民調機構預測的“平均誤差”與“平均偏見”,將二者平均得到名為POLLSCORE的準確性分數,負數代表表現比較好,數字越小民調越準確,意味着該民調的誤差與偏見更小。其中“平均誤差”是指民調數字與實際結果之差,“平均偏見”指的是該民調機構是否會系統性地偏向某一方。後者的存在是為了儘可能標註出存在偏見的民調機構,因為這些偏見可能在未來成為誤差的源頭,拉低民調的可靠程度。
“538”網站打分的第二個維度是透明度,指民調機構對於他們調查過程與結果的公開程度。在圖中靠前的幾個機構:紐約時報/錫耶納學院、YouGov等,都會公開民調的詳細原始數據,包括調查對象的特徵以及不同羣體的具體回答等。
這一榜單中排名靠前的機構,如紐約時報/錫耶納學院、ABC新聞/華盛頓郵報,都是十分可靠的民調調查機構,即便這些新聞機構都是以強烈偏民主黨而著稱。
但是這並不意味着,大新聞媒體所採用的民調一定會在選舉中表現良好。比如在21-22年選舉季的民調機構排名中。益普索(Ipsos)公司常常與路透社聯合發佈民調,並藉由路透社的名頭獲得極高關注。

21-22年選舉季的民調機構排名 網絡截圖
但實際上,根據圖中數據,該公司的平均誤差達到3.8(預測結果與實際結果平均差距3.8%),是最準確的薩福克大學或紐約時報/錫耶納學院的兩倍,並且只在17%的民調中正確預測了輸贏。該機構的偏見值到達了D+3.7(D代表偏向民主黨,+3.7代表比最終結果多了3.7%支持率)。
此外,在這一榜單的底部也能看到許多附屬於共和黨的民調機構,如RRH Elections、Insider Advantage、co/efficient、Moore Information Group等,這些機構在調查中對共和黨的傾向巨大。其中最為著名的是特拉法加集團(Trafalgar Group)。2020年特拉法加集團的民調數據十分準確,但並不是因為其在調查方法上具有優越性,(圖中可見其平均誤差在5.3左右)而是因為該機構持續高估共和黨,在普遍高估拜登的2020年“碰上了”,數字上顯得準確。但實際上其有明顯偏向的調查結果出現誤差才是常態,該機構也是2022年大力鼓吹“紅潮”的機構。這也説明了“538”網站將“平均偏見”納入考量的必要性。
對於一般的觀察者來説,“538”網站的實用之處在於,除了對機構打分評級,該網站還對收集的民調信息按統一標準將關鍵信息在網站上呈現。其中不僅有日期(Dates)、調查樣本數與類型(SAMPLE)、調查機構(POLLSTER)、結果(RESULT)、淨結果(NET RESULT)等信息,還包括贊助方(SPONSOR)的信息。

“538”網站彙總的民調數據 網絡截圖
這無疑幫我們從機構的角度評估一份民調的可靠性,如下圖中被用紅色菱形標出的紅鷹政治(Red Eagle Politics),這是一個共和黨相關的組織,提醒讀者注意該民調數據的可信度。

被標註由共和黨相關組織贊助的民調數據 網絡截圖
由於美國大選的“選舉人”制度,大選的最終結果實際上是由幾個“搖擺州”決定,因此近年來越來越多的民調將更多注意力放在這些搖擺州上,以求更直接準確地觀察和預言大選結果。
落實到2024年大選,這裏我們可以選擇538中排名最前的,親民主黨的《紐約時報》在10月14日和10月21日更新的兩份民調進行對比。在10月14日的民調中,哈里斯在全國範圍內以百分之二到三的優勢領先。七個“搖擺州”從圖中可見,哈里斯在內華達、密歇根、威斯康星州和賓夕法尼亞領先,但是除了賓夕法尼亞外領先幅度都不足1個百分點;特朗普僅僅只在亞利桑那領先兩個百分點,在北卡羅來納、佐治亞都不足一個百分點。可以説這七個州的民調基本都在誤差範圍內,事實上高下難分。

紐約時報的民調中,特朗普與哈里斯兩人在搖擺州的十分焦灼 網絡截圖

《紐約時報》14日的民調顯示,近期民調方向在往不利於哈里斯的方向演變 網絡截圖
但這份民調還顯示,不論是全美還是包括威斯康星、密歇根、內華達和北卡羅來納在內的四個搖擺州,民調數據都在往不利於哈里斯的方向移動。更重要的是,此前有不少調查指出,經濟是美國民眾最關心的問題,而哈里斯在這一問題上的信任度低於特朗普。可以説,僅憑這一份民調,我們就可以判斷,未來隨着時間推移,颶風影響擴散、哈里斯新人“蜜月期”逐步結束,更多搖擺州在民調上翻紅是可能的。
而在10月21日的民調中,這一趨勢得到了進一步確認。哈里斯的全國民調領先已經縮小到1%左右。同時七個搖擺州則出現了更明顯的翻紅趨勢:在賓州、內華達州、威斯康星州,哈里斯的領先幅度已經不足1%;剩餘四州,特朗普在保持領先的同時,依舊在亞利桑那州保持了2%的領先優勢。

《紐約時報》10月21日民調顯示特朗普獲勝的可能性正在加大 網絡截圖
同時相比於上一份民調,特朗普在威斯康星、內華達、賓州、密歇根州翻紅的趨勢更加明顯。可以説雖然兩位候選人在民調上差距依舊在統計誤差範圍內,但無疑再次印證了美國大選正在反轉的勢頭。

而21日,反轉趨勢更加明顯 網絡截圖
民調的價值及它能影響美國政治
在2024年距離大選僅有10多天、雙方關鍵州選情差距急劇縮小到低於統計誤差的當下,如果你要問筆者民調到底準不準?筆者只能回答:看情況。但是如果你要問它到底有沒有價值?筆者的回答只有一個字:有。
民調天生就是一個“事後諸葛亮”的行業。在寫作時,筆者瀏覽了大量雙方的材料,從為民調產業辯護到將民調產業批倒的,不一而足,浩如煙海。但所有的材料都存在一個共性,無論辯護還是批評全部只能是拿過去説事。
這意味着,所有對民調的批評者都和民調機構處於一個起跑線上,要麼拿着某些歷史數據説事,“事後諸葛亮”,要麼對着當下的方法論做一些似是而非的批判。但是我們要明白,再準確的民調數據本質上也還是對過去的感知。
就在最近幾個月,世界發生着快速地變化:特朗普第三次刺殺未遂、以色列升級中東戰爭、兩場颶風襲擊了美國東部。每一場短促的變動都會以分鐘為單位不停的吸引人們的眼球,不斷提醒着我們生活在一個怎麼飛速前進的世界中。而這些變化對民眾的衝擊是進行民意調查時無法預料的。
對於很多人來説,民調的價值就是要在這個飛速變化的世界中做一個最難的工作——預知未來人們心裏會怎麼想的。但如果僅僅把民調視為一個輸贏的風向標,或將美國大選這一複雜的選舉簡化為兩個數字之間的遊戲,那麼執着於民調的結果以預測未來的人可能會失望。事實上,民調最重要的作用或許是可以讓政治參與人對一些事件做出反應,比如民主黨高層借用民調數據迫使拜登退選。
如果我們不再把民調的關注重點放在兩個數字的大小與一時的輸贏比較,而是數字背後的人時,那麼它就有着獨特的價值。民調是一個窗口,讓觀察者們能夠將思考的權利從選舉宣傳機器手中奪回來,自己去探究美國社會的現實 。
理論上,所有的選舉政客們都希望選民忘記這個世界的現實,讓選民沉浸在他們精心打造的,圍繞兩個數字此消彼長而你死我活的世界中。此時,民調最大的價值恰恰在於,它不斷提醒着政客們,複雜現實不是兩個數字所能夠概括的。在數字之外,是一個廣大的世界與活生生的人,而這些人正在和這些數字以及關注這些數字的人互動,而他們的言行正在被人們所評價。
只不過,目前的美國看起來已如一些政客所願:2020大選前一個月的民調中,兩個陣營中大約80%的登記選民表示,他們與對方的分歧在於美國的核心價值觀,而大約90%的人擔心對方的勝利將對美國造成“持久傷害”。

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。