強舸:美國大選民調的玄機
9月27日(中國時間),美國總統大選第一次辯論落幕。特朗普和希拉里陣營各執一詞,都認為自己在辯論中表現的更好。那麼,手握投票權的美國民眾是怎麼看這個問題的呢?
一、極端對立的民調數據
首先,流傳最廣的(或者説被我國媒體採用最多的)是CNN在辯論結束後不久立刻公佈的一份民調,該民調顯示,有62%的投票者認為希拉里贏得了辯論,27%的投票者認為特朗普贏得了辯論。由此看來,希拉里的勝利是碾壓式的,特朗普大事不妙?
然而,在民調行業發達的美國,隨後不斷公佈的民調數據中僅有寥寥幾個也顯示更多的人認為希拉里贏得了辯論;更多的民調則顯示,受訪者一邊倒的認為特朗普贏得了辯論。例如,時代週刊的民調顯示,59%的受訪者認為特朗普獲勝;財富雜誌的民調顯示,51%的受訪者認為特朗普獲勝;Politico網站(也就是那個“郵件門”2.0披露出來,發稿前要先經希拉里團隊審核的美國政治網站)的民調更是顯示,77%的受訪者認為特朗普獲勝。難道説,希拉里大勢已去?
雖然我是特朗普鐵粉,但也不相信特朗普的民意優勢如此之大,至少在這場辯論中,特朗普在技術意義上可能還要略遜於希拉里(雖然是在主持人的傾向性過大,明顯幫助希拉里的前提下)。那麼,為什麼民調差距會有如此大的反差呢?幾十年來,一直被視作美國選舉風向標的民調究竟還可不可信呢?
二、民調中的玄機
美國大選顯然是個政治問題,其中的一舉一動都是高度政治化的,絕大多數做民調的美國媒體和機構都有鮮明的政治立場。不過,這些內容已經有很多人討論了,所以,本着“別人説過的話我不説”的原則,我這裏主要談一談這些民調反差中的技術問題。
1、樣本量
從圖中可以看出,最先公佈的、在我國吃瓜羣眾中影響最廣的CNN民調的樣本量最小,只有521人。其他民調的調查對象大多是數萬到數十萬不等。兩者差距巨大。不過,並不能僅僅因此就説CNN的調查對象最少,所以就最不可靠,這還要結合調查方式一起看。

2、調查方式和抽樣方法
CNN和其他民調最大區別是在調查方式上,那些樣本量數萬到數十萬的民調採用的都是網絡投票方式,而CNN採用的是電話調查,在這麼短時間內能找到521名受訪對象並非易事。
從調查方式來説,電話調查數據的可信度要顯著高於網絡調查。但是,CNN可疑的抽樣方法基本上毀了自己在調查方式上的優勢。
科學的抽樣方法要求分層(年齡、收入、受教育程度等等)、分類(黨派、男女、族裔、地域等等)、按比例(例如,所有人中男女比例是51:49,那麼抽樣時也應當保證這個比例)抽樣。當然,這種即時民調不可能做到這麼嚴謹,但是至少按黨派比例分類是必須的。然而,在這次CNN的521名受訪對象中,有41%是民主黨的支持者,26%的人支持共和黨,33%的人未表示支持任何政黨。
自兩黨候選人正式提名以來,CNN民調樣本中民主黨支持者比例過高的問題就一直被人詬病。在這期間,CNN民調大概採用的是民主黨支持者30%,共和黨支持者25%和未表態選民45%的抽樣比例。CNN的理由大致是這一比例是根據CNN觀眾的黨派分佈確定的,但問題是CNN被戲稱為民主黨的“中央電視台”,因而許多保守派選民根本就不會成為CNN的觀眾,也就是説,在黨派分佈上,CNN觀眾中的民主黨支持者會高於全美選民的平均水平。
而且,CNN這次民調中更是採用了比以往還偏得多的抽樣比例。CNN政治新聞主任查裏安(David Chalian)介紹,此次調查樣本中的民主黨成員比CNN以往民調中的比例高10%。所以,他補充説,這可能引起結果大約4.5%的誤差。
然而,就我們從教科書中學的定量研究基本原則(我是從美國教科書裏學的)來看,樣本和母本(也就是全美選民)如此巨大的差異,根本就不是引起誤差的問題,而是調查失敗、抽樣無效。估計,查主任在大學裏學統計時掛科了,並且補考也沒過吧。
3、樣本分佈:為什麼網友更支持特朗普?
因為有意操作導致的樣本分佈問題,CNN這次民調極不可信。不過眾多顯示特朗普獲勝的網絡民調的樣本分佈同樣有極大的問題,所以也不能當真。當然,與CNN不同,這並非是網站有意導致的(特別是極度誇張的數據還出自民主黨鐵桿Pollitico網站,我剛瀏覽了一下,該網站好像已經把這個有“反黨”嫌疑的民調數據撤了),而是網絡投票本身屬性導致的。
網絡投票沒有分層、分類、按比例(例如,所有人中男女比例是51:49,那麼抽樣時也應當保證這個比例)抽樣,因而某些羣體的投票率會遠遠高於其他羣體,最終導致數據失真(參見前兩天“百花獎”的獲獎名單)。
具體來説,雖然媒體一直炒作稱,特朗普支持者中,沒受過教育、收入低的白人居多。但白人畢竟是白人,在美國整體社會分層中,這些人都還是中層或者下層中的上層。此外,特朗普在非洲裔、拉丁裔等少數族裔中還有可能是共和黨多年來最高的支持率,支持他的少數族裔多數在本族羣中也處於較高層次。因而,特朗普的支持者從文化水平、經濟條件來看都是可以經常上網並有較多時間用於網上論戰的。
希拉里則不同,希拉里的鐵桿支持者以佔美國人口1%的鉅富階層和處於社會下層的非洲裔、拉丁裔美國人為主。這兩部分恰好都是不愛上網或者沒條件、沒時間上網的。
當然,民主黨的支持者中也有很大的愛上網羣體,這就是大學生和受過高等教育的年輕人。這一羣體可以説是整個美國社會(其它國家也一樣)上網最頻繁的羣體。在民主黨初選期間,他們體現出了強大的動員力,包括總額創造歷史的小額捐款、激情澎湃的線上線下動員。
然而,他們都是桑德斯的鐵粉,高度忠誠於桑德斯,也就意味着他們對民主黨本身未必有多大認同,希拉里本人眾多的黑材料和“郵件門2.0”中民主黨違背民主原則的對初選的操縱更是加重了這一趨勢。
總的來説,現在桑德斯粉絲分成了三類:第一類,寧可支持特朗普,也不支持希拉里;第二類,不去投票或者投第三黨候選人;第三類,含着淚把自己的選票投給希拉里。總的來説,第三類人還是佔多數,但是他們願意在大選時忍痛投票,可不意味着願意在無休止的網絡論戰中也使勁。

如果川普和希拉里都掉進水裏,誰能得救?
美國。
4、重複投票
重複投票的問題大家都清楚。當年,還沒有經過超級女聲、快樂男聲、加油好男兒、中國好聲音以及微信朋友圈拉票(我家大侄子、朋友家的孩子等等等拜託大家支持一下)洗禮的中國網民,在2002-03賽季就靠網絡刷票,將還未在火箭隊站穩先發的姚明投進了全明星先發,創造了NBA全明星賽首次有一年級新秀成為先發的歷史。美國羣眾在這點上雖説還和我國網民差不少,但多少也學了點。
當然,有的網站採取了限IP等措施防止重複投票,這種措施雖然有作用、但顯然解決不了重複投票問題的道理,大家都是懂的。
三、別把民調太當回事
從我們學科來説,美國學界一直在努力將政治學發展成政治科學。然而政治學科學化的路徑一直不順,很多宏大命題過些年就要重新吵一次,幾千年了都形成不了定論。
這些年來,在政治科學中,恐怕唯一能讓多數人都覺得比較成熟的、比較科學化了的領域,就是對美國(以及一些西方國家)選舉的研究和預測,美國學界在這方面也持續投入着極多的資源和關注。然而,這次美國大選(初選)以及英國脱歐公投、法國地區選舉、奧地利總統大選等一系列選舉的結果,都狠狠打了選前民調和專家研究預測的耳光。
政治科學,科學化總是逃不出政治化的魔爪。What a pity!
另外,美國大選辯論雖然熱鬧,但是其實對選民選擇影響並不大。特朗普在剛宣佈參選時曾經説過:“我在第五大道開槍射擊也不會掉粉”(大概這個意思,當然隨着選舉深入,現在他不再説這麼奔放的話了);希拉里和民主黨更有過之,“郵件門”、班加西事件、“操縱選舉”、“買官賣官”、克林頓基金、健康門,以及過往的被強姦的小女孩、“白水門”、“殺拉里(killary)”等等黑材料的輪番衝擊下,居然依然屹立不倒。
所以,和美國佬耍嘴皮子用處真不大,美國羣眾這點確實比我國羣眾強,小英、蜜雪兒(即奧巴馬妻子米歇爾)、奧巴馬的雞湯以及克林頓的深情告白在微博、朋友圈可都是風靡一時,無數人被感動得不得了,最差也是個10萬+。
目前來看,多數美國羣眾在大選中最看重的還是候選人的政策。所以,對大選辯論來説,首要的不是場面上贏不贏(注意,此次辯論後民調的基本問題是“你認為誰贏得了這次辯論”,和“你將把票投給誰是完全不一樣的”),而是,第一,不讓對方抓住致命弱點;第二,讓自己的政策主張更加清晰地呈現出來。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。