華裔能當上美國總統麼?我Python了油管評論_風聞
我这人爱比较-2019-09-09 20:12
作為中國人,你問我資瓷不資瓷華裔當美國總統,我只能説無可奉告。
國人對美籍華裔的複雜感情,以下兩組照片很能説明問題了。


刷油管時我注意到個人,楊安澤(Andrew Yang)。他是美國史上第二位宣佈參選總統的華人。我最初注意到他的確是因為他的華裔身份,之後的持續關注倒和他的族裔無關了。

他提出的政策很有趣。
大家好,我是楊安澤,我當選總統,會給每個滿18歲的美國人每月發1000美金
聽起來像個大忽悠對吧?
Why do we do it? We already automated away millions of manufacturing jobs and chances are your job could be next.為什麼我要發錢?因為成千上萬的工作崗位因為自動化消失,你的工作很可能就是下一個。
他是我所知的第一個正式用AI,自動化解釋各類社會問題的政治人物。多聽他幾句,瞭解了他發錢的動機和邏輯後,你會覺得他和其他喜歡從道德角度談問題的候選人相比,簡直就是一股唯物主義清流。
其實,我覺得他最有趣的言論出自2019年2月份的一個演講視頻。

很明顯,演講受眾是亞裔
鏈接: https://www.youtube.com/watch?v=_Qf2EX0d9AY
I think we’re one generation away from falling into the same camps as the Jews.
我覺得我們(華裔/亞裔)離進集中營只有一代人的時間了。
到2045年的時候,美國會成為少數族裔佔多數的國家。如果你看歷史的話,人口占多數族羣不會自然放棄其主導地位,那種越來越多元而使一個社會越來越包容的願景並不是歷史的常態。
你發現那種因為感到不安而懷有敵意的白人已經越來越多了。而誰會是那個在接下來20年裏不斷挑戰美國的“壞蛋”呢?
中國
這時候,那些失去工作的白人會怎麼看美國華人和亞裔?
我覺得我們(華裔/亞裔)離進那種類似猶太人住過的集中營只有一代人的時間了。
我很害怕,我有兩個6歲和3歲的小孩,我和他們都是美國公民。
他的想法是有歷史依據的。珍珠港事件後,美國把約12萬的日裔平民投入集中營,其中約64%是美國公民。

同一時期,作為德裔艾森豪威爾被提拔為歐洲戰區司令。二戰後,艾森豪威爾被認為有意的通過製造饑荒的方式將大批德國戰俘虐殺。
納粹固然可惡,美國的德裔和日裔也不能簡單拿來相互對比,但我還是不禁回想起文章開頭提到的老賊呂超然,有些現象是具有普遍性的。
不少華人反對他,因為他曾發推支持哈佛按種族而非成績招收學生。
我認為針對哈佛歧視亞裔考生的訴訟是不合理的。學校在錄取學生時應該考慮多種因素以達成不同目標。亞裔目前佔錄取人數比例的23%,一個新高。———— 楊安澤
我想到明朝南北榜事件,以及……嗯……你懂的。只是華裔在美國既不是北方考生也不是南方考生,更不是朱元璋。
我中國人,我看戲。
不過我覺得未來中國對外政策會越來越剛,如果他能以華裔的犧牲緩和美國針對中國人的種族矛盾,對隔着太平洋的我們來説似乎沒什麼不好。
在2019年7月31日的民主黨候選人辯論後,楊引起了更非常多關注。這裏再列一些他的語錄和觀點。
成千上萬的工作崗位因為自動化消失,你的工作很可能就是下一個。
你如果去工廠,你不會看到大批的移民,你看到的將是一排排的機器。移民成為了我們經濟問題的替罪羔羊。
工作被自動化取代是我們今天所面臨的最大挑戰,這就是為什麼特朗普成了美國總統。意識不到問題的領導人辜負了美國人民。(希婆口號:美國已經很偉大)
我們(候選人們)化了妝,演練好互相攻擊的內容,在這個真人秀(候選人辯論)上扮演各自的角色。這就是美國選出了個真人秀明星當總統的原因之一。我們應該聚焦當今社會所面臨的真實問題,比如10年內那些最普遍的崗位會被機器取代…
我這不是在搞社會主義,如果大多數人連資本都沒有,我們還叫什麼資本主義。
全民基本收入UniversalBasicIncome(UBI),錢從哪來?
阿拉斯加州用石油收入給每人每年發1000-2000美元,這個先例政策實施了37年,技術就是這個時代的石油。
每筆因AI和自動化所創造的新財富,我將通過向技術公司收税的方式確保美國人民從中分一杯羹。
很多美國人日子都緊巴巴,所以多數發出去的錢會馬上用於消費,回到經濟循環,刺激經濟和税收的增長。
我會從如監獄系統,對無家可歸者的社保以及急診醫療類的政府福利花費中削減開支,因為UBI會減少這類社會問題。
UBI不是當前已有福利的額外福利,它保證的是每個人總的福利不小於1000美元。比如你領了600美元的食品券,UBI會給你400美元保證你享受總額1000美元的福利,而非給你額外的1000美元。成年人口乘以1000美元這個公式計算得出的政策總花費實際要扣減多數美國人已經取得了各類的福利花費,所需的額外開支會小很多。當然如果有人當前已經享受了超過1000美元的福利的話,此項政策也不會削減他/她的福利。
在看了幾個楊的視頻後,因油管推薦機制,我的油管主頁不斷出現楊的其它視頻。視頻下評論一邊倒的叫好。
還有幾個視頻,支持共和黨的右翼FOX新聞台對他做了專訪。評論區中那些明顯傾向右翼的觀眾所給出的評論也非常正面。很多人自稱上屆大選投了特朗普,現在要轉而支持民主黨的楊。
很難想象能有其他民主黨候選人能做到這一點。
就我個人對美國的認知,我一直相信華裔不會有什麼政治號召力,我甚至都不覺得他能被注意到。但發生在他身上的事情對我的認知形成了一定的挑戰。
正文開始
油管推薦機制好煩,老給我推楊的視頻(“我為啥要點開??”)。能扯出那麼多關於楊的信息,全拜這個推薦機制。
雖然我這個人愛比較,但我沒足夠動力去了解每個候選人的背景及政策主張。那該如何看待這些“硬”入我眼簾的信息?我決定做點功課,用python把油管評論數據量化一下。
查谷歌文檔,發現油管是有視頻評論數據接口的,然後就是一番折騰……
我會從那些主題關乎整個選舉的視頻下提取數據。假設此類視頻觀眾羣是整體選民,而非某個候選人的粉絲。
我第一組評論素材來自The Colbert Reprot節目頻道的一個片段。

此節目是美國喜劇中心頻道的一檔新聞類喜劇脱口秀,通過喜劇搞笑的方式報道新聞(或者新聞的方式做喜劇),每期都會有各種國內外的政治人物被挖苦諷刺一番。
民主黨候選人第二次辯論分兩天舉行,候選人被分為兩組,分別在7月30和31日兩天進行對決。7月31日,也是楊參與的第二輪辯論當天,此頻道放出8個視頻片段。
其中兩個片段的主題分別就兩天的辯論點名挖苦各組候選人。一個片段主題是挖苦所有候選人。

剩下視頻主要是訪談之類的。
我選取了聚焦31日辯論內容的節目片段,楊參與的那場。

片段時間為7分21秒,當日參與辯論的所有10位候選人都在視頻中被提及。
楊被提及三次,出鏡率算高的,不過按節目尿性,這隻能證明編劇能從他那裏找到槽點。
視頻並沒有針對或側重報道任何一位候選人,且對所有候選人都是一副負面的嘲笑態度。
那視頻下面的評論是什麼樣的呢?
截止我寫此文之時,視頻下共產生2646條評論,時間跨度為整個8月份。不少評論是對他人評論的回覆評論,會在同一主題上不斷糾纏,所以排除。我拿最後剩下的1434條評論作為分析對象。
兩個晚上共有20位候選人蔘與辯論,根據他們的名字,我定義了20組關鍵詞。某條評論中如果出現某個候選人對應的那組關鍵詞,既被認為此條評論提到了這個候選人。比如某評論出現sanders或者bernie,就判斷次條評論討論了桑德斯,出現biden或者joe就判斷在討論拜登,不會100%但基本靠譜。
統計各候選人在評論中出現的情況,可得下圖。
各候選人被評論提及次數(總評數:1434)

被提及各候選人評論佔比

很明顯了,似乎大家都很喜歡談論楊安澤,這符合我肉眼看評論的觀感。
順便説一下,排名第二的候選人是個叫Tulsi Gabbard的美女。當過兵,信印度教,有1/4薩摩亞血統,去敍利亞見過阿薩德,並因此受到各種攻擊。總之,也不是個傳統意義上的總統候選人。
有意思的是,評論中出現了不少重複數據。提取這類數據,發現

出現重複的評論全是支持楊的口號,這些評論加起來有53條之多。相比而言,現任總統川普的“Trump2020” 出現了2次,總評論排第二的Gabbard 的“#tulsi2020” 出現了3次。其他候選人沒有類似情況。
加上時間維度,會是怎樣的效果?
這裏只選取4位候選人進行呈現,除楊,Gabbard,前副總統拜登着3位排名前三的候選人,我按個人喜好加上了持左翼政策主張激進的桑德斯,他在中國可能相對有點知名度。楊表示上屆選舉本想投桑德斯的的,結果桑德斯在民主黨黨內選舉被希拉里幹掉了。
首先看數量。
因為隨時間推移,視頻熱度遞減。我僅展示前10日評論情況。
前10日4位候選人評論數

看來評論遞減對數據呈現影響還是不小,不過楊的藍色展現出明顯優勢。
再看評論佔比比例(全部)
4位候選人評論佔比

比例,前10日
前10日4位候選人評論佔比

到月中時,數據已經很少,沒有太大意義了。不過還是會有人提到楊,而其他候選人沒有這個待遇。
用類似的方法,我們換個視頻看看楊的表現。其實做這類評估,最具代表性的視頻是候選人辯論視頻本身。然而素材不是很理想。
民主黨候選人辯論目前共進行了兩輪,NBC新聞官方只放出了第一輪辯論的視頻。那輪辯論,楊僅發言3分鐘,是所有20名參與者中發言時間最短的。楊和另外兩名候選人反映當時麥克風有問題,他們只有在被主持人叫到的時候才能講話,而其他候選人可以中間插話。第二輪辯論,楊發言時長8.7分鐘,仍然最短短,但足以闡明觀點,因此贏得很多關注。
既然沒有最新視頻,那還是回到6月的第一輪辯論錄播視頻,看看評論區是什麼狀況。
先大致瞭解下視頻本身的情況

視頻發佈於2019年6月27日,共有近400萬播放。踩視頻的人比點讚的人多。視頻時長兩個半小時,我並沒有看,查維基得知楊發言3分鐘,時間佔比2%。不過,關心楊的評論遠多於2%。截止8月底,排除評論下的子評論,視頻下共有評論9493條。提到楊的評論數達到1927條,佔比達到20%,數量遠多於他候選人。
首輪辯論錄播,提及候選人評論數(總數:9493)

佔比

最常見重複出現的評論

可明顯發現,人們很關注楊。不過從重複出現的評論可看出,楊的麥克風問題可能引起了不少不滿。我覺得這種強烈情緒的存在降低了數據説服力,畢竟一般觀眾懶得發評論,當然他們也可能懶得投票。另外,我們這個視頻的評論中有不少川大統領支持者。
加上時間維度
提及次數

佔比(視頻發佈後10日)
查看完整時間段評論佔比情況,發現一直會有很大比例的評論提到楊。
佔比(發佈後至8月底)

檢查最後20天評論數發現,視頻即便已經發布了快2個月了,還是有一定數量的留言。留言中楊被提到的幾率更高了。
佔比(8月最後20日)

本來我還做了語義分析,但使用的庫處理下來準確度較低,結果就不放這裏了,也許以後會補充這個維度,不過可能是探討其他主題了。
語義的話我給個肉眼觀感——楊不但被大量評論提到,還普遍獲得了正面評價,而大多候選人是富有爭議的。想到右翼FOX對楊的好感,我覺得他吸引共和黨選民能力會很強。
就已有統計結果,總的來説,從油管評論區看,楊受到了非常多的關注。雖然看油管評論預測美國大選是件很不靠譜的事情,但我相信這些觀察還是有些價值。
一段時間後再進行回顧,這些觀察也許這能側面幫助我們認識思考更多問題。
社交媒體,視頻媒體對社會的影響力多大?
美國建制派對國家的掌控力有多強?
我們平時使用的新聞渠道可信度多高?
自動化與人工智能對社會會產生什麼樣的影響?
生產資料集中化,私有化背景下的財富分配問題。
還包括是我個人非常關心的,認真考慮過的,未來共產主義的實現問題。

一番操作猛如虎,最後有個打臉。
wo隨便找了個民調機構,這是他們的數據。其他機構的數據大致類似。

前副總統拜登遙遙領先,楊縮到了很靠後的角落。
這意味着什麼,每個人都會有不同理解。
我就練練Python,陪大家看戲。
#見諒,一些圖貼過來後發現字太小了,懶得回去改,各位讀者老爺就看個顏色吧,見諒,
