四年前翻車的大選民調,還值得信任嗎?_風聞
海国图智研究院-海国图智研究院官方账号-海国图智研究院,新型、独立的国际关系社会智库2020-09-09 11:24
摘要:大選民調對哪位總統候選人入主白宮有很大的參考價值,但2016年大選,被多數民調機構認為勢在必得的希拉里敗北,使不少人對民調的準確性持懷疑態度。現距2020年大選結束不足兩個月,民調數據顯示拜登有着不小的優勢,但2016年民調“翻車”歷歷在目,受創者疑慮舊事重演,有人對民調數據半信半疑,有人甚至認為民調結果不可信,須與之背道而馳。要破除盲目的懷疑需要對四年前的預測失敗做一個回顧。本文將通過闡釋何為大選民調的準確性來為民調的“翻車”翻案,回顧2016年大選民調失敗的原因,並探究導致失敗的這些錯誤是否可以被糾正。本文最後將探討2020大選各類機構的民調是否就這些錯誤做了修正,以及當前民調還存在着哪些問題。
關鍵詞:大選民調 、2016大選、 2020大選
2016年大選結果分曉前,民調給人們的印象是:入主白宮,希拉里勝券在握。因此,當11月9日特朗普當選的消息一出,民調行業首當其衝,被認為“失敗了”,“不準確”且不可信。四年後,美國又一次大選,不少人對大選民調保持了謹慎乃至懷疑的態度。那麼,從民調的發展歷史看,其預測結果變得越來越不準確了嗎?2016大選民調是不準確的嗎?當下的大選民調還值得相信嗎?
民調的準確性是指什麼?
民調是對某地某時的羣體意見進行判斷的截面圖,它是羣眾在主要事務上意見和取向的直觀反映。**從民調發展的歷史來看,民調的方法越來越嚴謹,其預測結果總體來説也越來越準確。**民調興起於19世紀的美國,一開始即被用來預測總統大選。1827年,賓夕法尼亞州的《哈里斯堡賓州人報》成功預測了安德魯·傑克遜的當選,民調開始流行。當時,多為新聞媒體開展民調活動,受訪者大多是這些媒體的讀者或隨機訪問的路人,樣本挑選不夠隨機,代表性亦不足。1936年,新型民調機構蓋洛普(Gallup)廣泛收集數據,根據人口分佈特點設計抽樣方案,成功預測了富蘭克林·羅斯福的壓倒性勝利,而堅持老辦法的《文學文摘》(Literary Digest)則一敗塗地。此後,大多數的民調機構在樣本選擇、數據分析等方面,均採用新型統計方法。由此可以看出,民調的方法經歷了一個由粗糙到嚴謹的發展過程。
除了方法的改進,美國還存在着促進民調發展的機構。1948年大選,民調預測托馬斯·杜威處於優勢地位,但結果卻是哈里·杜魯門成功當選。這一失敗引起了民調行業對其未來發展的擔憂,即後促成了美國民意研究協會(American Association for Public Opinion Research, AAPOR)的成立。此協會現由2000多名公共輿論、民意調查等方面的機構或業內人士組成,強調民意研究對民主政體的良性發展至關重要,規定所有成員須遵守的民調道德與標準,創辦了《民意季刊》(Public Opinion Quarterly)等重要刊物,對民意調查的發展起到了促進作用。2016年,在普遍認為民調預測失敗的情況下,美國民意研究協會聯合其成員對這一“失敗”做了分析與反思。
自1936年以蓋洛普為代表的新型民調機構出現後,全國性大選民調預測結果的絕對誤差基本呈下降趨勢(圖1),也就是説其準確性呈上升趨勢。不過,民調的準確性是什麼,民眾和專業從事民調者有不同的看法。復旦大學的王中原認為,“媒體和大眾更關心誰勝誰負,學術研究則更加追求預測精度”。**學術研究上的預測精度則是指,預測結果與實際結果之間的差距大小。**假設在一場大選中,候選人A在民調中領先8%,最終的實際支持率領先1%,則民調成功預測勝負,預測結果和實際結果之間相差7%;在另一場大選中,候選人A在民調中領先2%,但最終的實際支持率落後3%,則民調未能成功預測勝負,預測結果和實際結果之間相差5%。儘管從勝負上看,假設中的前者成功了,但在預測精度上後者更高。實際上,著名民調機構538(FiveThirtyEight)主編奈特·希爾沃(Nate Silver)亦認為,民調結果的準確性不是根據預測結果與實際勝負是否一致為準繩,而應該以測量結果與實際結果之間的差距大小為判斷。民調若盲目地追求勝負,而不顧準確度,則預測的成功率將有很大的波動性,其本身也無法解釋影響選民的複雜因素,更無法對大選後的種種情況做準確的分析。
圖1 大選倒計時21天民調的誤差,1972-2016 來源:538網站
受限於技術手段、難以預測的投票率和大選中不確定性事件的出現,大選民調無法做到與實際結果完全一致。儘管無法做到絕對一致,全國大選民調的準確度還是在不斷提高。圖1顯示,2016年全國大選民調的準確率要高於2012年,低於誤差平均值。2016年,在普選票上,希拉里的得票率為48.18%,特朗普的得票率為46.09%,落後希拉里2.09%,這與全國大選民調預測的希拉里領先3%相差甚小,即準確度相當高。那為何四年前的大選民調留下了失敗、不能信任的印象呢?
2016年大選民調翻車了嗎?
2016年大選結束後,媒體和公眾普遍認為大選民調喪失了準確性。造成此種印象有兩個主要原因:一是多數媒體對希拉里獲勝有膨脹的信心,報道有失偏頗;二是預測與最終結果不一致。
首先,媒體對希拉里勝出幾乎無懸念進行大肆渲染,挑選有利的數據佐證觀點,而當特朗普勝出後,又指責大選民調誤導羣眾。在2016年總統競選過程中,民調顯示有此次大選變量較多,有高度不確定性。但媒體認為希拉里睿智的競選政策、特朗普的種族主義都使得希拉里在選舉人團層面有更為明顯的優勢,甚至認為科米重啓郵件門的調查也無法改變這一領先地位,忽視了大批搖擺選民(undecided voters),即大批猶豫不決、不知道要投給誰的選民。多數媒體把民調中希拉里的優勢解讀為其將入主白宮。在選前一週,民調顯示希拉里也僅稍稍領先,卻仍被媒體報道為獲勝幾率十分大。大選結束後,媒體聲稱大選民調預測失敗,在將來也不能再予以信任。**媒體作為信息的承載和傳播者,影響着羣眾對具體事務的看法,但其本身存在的諸如缺乏嚴謹分析、抗拒不確定性以及惰於自我糾正等弱點,導致其對大選民調的報道中存在誤讀誤傳的情況。**此外,有研究表明,媒體過度的渲染可能導致希拉里支持者信心高漲,但投票熱情減弱。
其次,民調預測希拉里當選幾率更大,但最終特朗普當選,更關心誰勝誰負的媒體和大眾便直觀地認為預測失敗了。**普選得票率更高的希拉里未能勝選,特朗普成了“少數票總統”,這是由美國獨特的選舉人團制度(the electoral college)造成的。**在美國歷史上,現僅有五位少數票總統,一般來説,在普選中獲勝的總統也將獲得更多的選舉人票。選舉人團由538名選舉人組成,每州的選舉人數量等於其參眾兩院議員的總數,哥倫比亞特區的選舉人數量同人口最少的州一致。贏得一半以上的選舉人票數,即贏得選舉。這一制度一定程度上保障了人口較少州的權利,維護了聯邦制的穩定,但除緬因州與內布拉斯加州外,美國各州施行贏者通吃(winner-take-all)的規則,故此公民因居住地不同而擁有不同價值的選票。正是由於這一制度,極小的難以預測的選票優勢或弱勢即可能會導致大選結局的不同。在2016年美國大選中,三個倒戈的藍州都被共和黨以極弱的優勢獲取。特朗普以0.23%、10704張選票在密歇根州領先,以0.73%、44292張選票拿下賓夕法尼亞州,在威斯康辛州又以0.77%、22748張選票贏得威斯康星州,最終憑借不到8萬的選票拿下了此三州全部共46張選舉人票,翻轉了不利局勢,擊敗了普選票領先287萬的希拉里。這三州的最終選票差距都在1%以內,十分細微,均處於民調的合理誤差範圍內。但正是這難以預測的細微的誤差起到了關鍵作用,使最終取得232張選舉人票的希拉里失利。
2016年大選全國民調總體是準確的,也高於民調預測的歷史平均水平。人們對民調做出預測失敗的判斷,一方面是由於媒體的渲染,另一方面是因為預測當選者與實際勝出者不一致。無論是媒體的推波助瀾,還是由於特殊選舉制度帶來的大選反轉和無法偵察出的極小的最終選票差距,都不是民調本身的問題。但這並非是説2016年大選民調不存在問題。
**2016年大選民調錶現不佳,州級民調需負很大責任。**全國大選民調僅是對當下全美選民觀點和態度的反映,而在實行選舉人團制度的美國,州級民調的參考價值更大。不過,由於資金不足,自身黨派傾向以及調查方法相對單一等問題,州級民調的準確率常常要低於全國民調。圖1顯示,自1972年起,州級民調的誤差平均值比全國民調高0.7,但2016年州級民調的誤差平均值更高,比平均誤差值高0.4,比當年全國大選民調則高出2.1。
**一般認為,2016年民調的主要問題是低估了教育程度不高的白人對特朗普的支持率,這一問題在州級民調中尤為明顯。**美國民意研究協會的一份報告顯示,諸多研究表明低學歷或無大學學歷的選民不願參與民調,在多屆大選民調中代表性不足,而高學歷選民則相反,其樣本比例常常過大。2016年,此種情況再次發生,對民調的準確性造成了實質性的打擊。那麼,往屆大選中這種情況為什麼沒有打擊當時的民調呢?這一問題的答案在於,在此前的大選中,高中及以下學歷的選民與研究生學歷的選民基本投給同一候選人,所以一端代表性不足和另一端樣本比例過多相互抵消,未能根本上影響大選民調的準確性。但在2016年,高中及以下的低學歷選民與高學歷選民之間產生候選人分歧,抵消效應不再產生,由此產生的準確性也不復存在了。
前文提到,2016年全國大選民調的準確性是高於歷史平均水平的,且高於2012年大選民調的準確率,那麼受教育程度這一因素為何沒有對2016年全國大選民調的準確性產生不利影響呢?奈特·希爾沃(Nate Silver)認為, 民調低估了低學歷白人對特朗普的支持,但也低估了非白人或高學歷選民對希拉里的支持,二者相互抵消,故全國大選民調的準確性未因低學歷和高學歷選民的分歧而受影響。不過,美國民意研究協會的報告稱,2016年全國大選民調準確性高是因為全國大選民調機及時構調整了不同學歷選民的比例。
不管出於何種原因,全國大選民調的結果是相對準確的,不準確的是州級民調。2016年州級民調未能重視學歷對大選的影響,低學歷的選民代表性不足既無法同州內的高學歷過度代表抵消,也因侷限於一州之內,而無法產生類似全國大選民調那樣的抵消效應。在起到關鍵作用的三個倒戈的藍州中,州級民調正是由於對教育因素的重視不足,低估了特朗普的支持率。在大選結束兩週前,威斯康星州民調顯示,希拉里領先特朗普2-12個百分點,但最終後者拿下了該州;賓夕法尼亞州民調則對其支持率低估了4-5個百分點;密歇根州民調則平均低估了3.5個百分點。出口民調(exit poll)表明,在此三州,無大學學歷的白人羣體對特朗普的支持起到了翻轉選情的關鍵作用。州級民調中對低學歷白人選民代表性不足的慣例、選前對特朗普的低估、低學歷白人對大選選情的逆轉作用,都指明2016年州級民調中低學歷代表性不足造成了其預測不準確。
影響2016年大選民調預測“失敗”的重要因素還有以下兩個。第一,搖擺選民。2016年,無論是特朗普還是希拉里,都未受到熱切的支持。許多選民在九月份、十月份的民調中表示他們不知道要投票給誰,或者考慮投給其他黨派,這一現象在中西部的戰場州尤為顯著。在密歇根、威斯康星、賓夕法尼亞三州,11%至15%的選民在選前最後一週才決定手中選票的歸屬,而出口民調顯示這些州的搖擺選民大多投給了特朗普。第二,“支持特朗普羞恥現象”(shy Trump effect), 即民調受訪者羞於表露自己是特朗普支持者。2016年,由於特朗普種族歧視等出格言論,其部分支持者在接受民調時,不願表明自己將會把選票投給特朗普。2016年,比起面對面採訪選民,民調機構通過電話採訪得到的特朗普支持率要高2%至3%。選後民調顯示,35%的特朗普支持者表示曾不願對外透露誰是自己支持的候選人。無論是州級民調對低學歷選民的忽視,還是搖擺選民與shy Trump effect,都對2016年大選民調的準確性產生了不利影響。那麼四年過去,這些問題改善了嗎?
2020大選民調的進與退
前文已經指出,2016年的全國大選民調並未翻車,與此前的民調相比亦相當準確,民主黨在三個關鍵的戰場州也只是以極小的最終選票差距失利。無論從民調準確性不斷提高的趨勢來看,還是考慮到2020年大選民調在一些問題上已有所進步,2020年全國大選民調都值得信任。不過,這並非是説2020大選民調十分完美,不存在問題和不確定性。
首先,受教育程度仍然在不同學歷層次的白人選民中發揮重要作用,影響着其投票取向。皮尤研究中心(Pew Research Center)2020年8月份的報告顯示,特朗普在低學歷和高學歷白人中的支持率分別為64%和38%,拜登在這兩類白人中的支持率為34%和61%。這表明低學歷和高學歷白人的候選人分歧仍然存在,抵消效應無法產生。2016年大選結束後,不少民調機構進行了自我反思。美國民意研究協會發表了長篇文章分析民調預測的“失敗”,指出全國大選民調考慮到了不同學歷白人對預測結果的影響,問題在於多數州級民調忽視選民受教育程度對選票產生影響。慶幸的是,州級民調在這一問題上有所改善。《紐約時報》(The New York Times)五月的一篇報道稱,2016年,僅約20%的戰場州州級民調適當調整不同學歷白人在樣本中的比例,而這一比例在2020年五月份已接近50%。
其次,搖擺選民的比例比四年前大大下降。2016年,不少選民猶豫不決,不知將票投給誰或打算投給其他的黨派。但最終這些選民,尤其是戰場州的白人藍領,大多數投給了特朗普。《新聞週刊》(Newsweek)的一篇報道稱,2016年8月份,約有20%的選民徘徊不定,現在這一比例為10%。
但2020大選民調也有問題。首先,shy Trump的現象仍然存在。2020年大選民調中,拜登的支持率持續領先特朗普。對此,特朗普的支持者和民調懷疑者認為,2016年羞於公開支持特朗普情況的再現可能導致了特朗普落後的支持率。儘管美國民意研究協會的報告曾表示,**沒有足夠的證據可證明shy Trump現象,但在美國政治極化的氛圍下,自由充分的政治意見表達確實遇到了阻礙。**卡託研究所(Cato Institute)七月份的研究表明,77%的保守派、53%的自由派以及64%的温和派認為如今無法自如地分享政見了。這將給民調了解真實的民意帶來困難。
其次,儘管搖擺選民比例下降不少,但2020大選民調顯示,多數拜登的支持者是為了反對特朗普,也就是説,其根基並不穩固。當同等不利的不確定事件發生時,他的支持率恐將受到更大的波動。此外,雖然不少州級民調開始重視教育這一變量,但由於資金不足、民調不嚴謹、民調機構之間不協調,州級民調的準確性仍無法和全國大選民調相比。這使得全國大選民調即使準確地預測出普選票領先者,也因州級民調而無法對這一領先者是否能獲得多數的選舉人票做相對準確、有把握的預判。
總的來説,2016年的全國大選民調是準確的,出差錯的是州級民調。四年之後,2016年大選民調出現的問題得到了一定的糾正,但也有一些問題遺留至今。從民調的發展歷史來看,其準確性在不斷提高,全國大選民調更是如此。全國性的民調組織亦在不斷促進民調機構進行反思與改進。因此,**2020年的全國大選民調仍值得相信,但需要對錶現不佳的州級民調保持警惕。**可以看到,文中提到的三個關鍵的搖擺州,其州級民調的表現均不佳,一定程度上放大了希拉里當選的信號,誤導了民眾。四年後,州級民調雖有一定改進,但因資金不足民調機構之間不協調等問題,其準確性仍不能和全國大選民調相比。