美國爆發40年來最致命流感?三招教你甄別信息的真偽_風聞
今天敲钟人不来-2020-01-23 22:04
來源 | 顧而言之
美國爆發40年來最致命流感?
三招教你甄別信息的真偽
提升決策的正確性
昨天看到一篇標題很嚇人的文章,説美國爆發了40年來最致命流感,6600人死亡。而且27年來首次再現乙型流感病毒。
一開始我想沒多想,但後來覺得不對勁,於是跑到外網查了一下,發現這個信息裏面其實有好幾個容易誤導人的地方,在此一一披露。
順便也聊聊,我們會被信息誤導的常見盲區。
下面這篇是我昨天看到的文章,説美國爆發了40年來最致命流感,6600人死亡。而且27年來首次再現致命性乙型流感病毒。
要查一下美國到底發生了什麼,最簡單的就是跑去谷歌上搜索。
簡單搜索一下幾個關鍵詞,bad flu America(美國流感)就會看到與其相關的所有新聞。
最先出現一篇是紐約時報的,説的大致意思是,這次的流感季可能會很糟糕。在下方的文章概要裏可以看到一些比較驚人的數字:比如説,46個州都有流感的跡象,6.1萬美國人死於流感。
再往後翻會發現有一些標題和我看到的中文標題有類似的內容。
比如説,一個叫The Hill的媒體説2020年可能是最糟糕的美國流感季。也許這就是中文媒體標題的一部分來源。但是你仔細去讀,這篇文章其實説的是2020年可能會像2017~2028那個流感季一樣糟糕。
也就是説今年並不是最糟糕的,而是最糟糕的之一。那麼我們已經破除了一個信息上的誤區。
再往後翻,搜索的結果中就沒有什麼流感相關新聞了,甚至已經跳到了跟中國相關的新聞了。
也就是説這個流感季的新聞,在美國媒體界看來,不是什麼驚天動地的事,不然的話可能會有好幾頁的搜索結果都跟它相關。
其實,如果你在美國呆過幾年,你就會知道,每年秋冬季節都是美國的流感季。所以的確有可能,流感的流行在美國並不是什麼大事。
今年美國的流感到底有多糟糕呢?
我們先點進紐約時報的報道去看一下。因為要具體瞭解一件事情,不能只看標題。
在文章裏,你會發現最早我們在文章概要裏看到的6.1萬美國人因流感致死的數字,其實指的是2017~2018那個流感季節中的人數。
所以並不是今年有6.1萬人死亡,但是如果只看文章概要,就可能容易得出這種結論。
另外,只看一家數據是不夠的。如果要驗證一個消息的真偽,就需要看不同的來源做數據的對比。
我看了好幾個新聞,發現它們引用的都是美國一個叫做CDC的機構的數據。而且數據都差不多,都是説有差不多2900人死於這一個流感季。另外預測可能有1300多萬人得了流感。
CDC全稱叫做美國疾病防治和控制中心,它每年都會發布關於流感季的數據。
如果要接着尋求數據的真實性,就要找到它最早的來源。於是我就跑去了CDC的網站。把相關的東西全看了幾遍。
裏面有一些比較關鍵的數據,可能也是各媒體援引的最早來源,就是以下面這張圖表。
它上面寫了從2019年10月到2020年11月11號,可能會有1300萬到1800萬人患了流感,然後其中可能會有6000多人因為流感而死亡。
聽起來好像各個媒體報道的並不假,但是裏面有一個核心詞,Estimates(預測)。
預測,什麼意思?CDC也寫了,預測就是説它其實是通過對於美國3億人口裏8.5%的人口進行抽樣調查,然後再通過一個數學模型計算得到的這個數字。(原文如下)
也就是説如果CDC調查的樣本所取的地方是流感的高發地區,那麼這個預測就有可能是過高估計了。我沒有看到它的樣本具體來源,不過通常應該是會去高發地區和低發地區做更平均的取樣。
因為是預測,所以CDC上所有的數據都是個範圍。比如説,死亡數從6600人到17,000人都有可能。而不是單一的6600人,像媒體報道那樣。
那麼17,000人是什麼概念呢?
因為之前有美國的新聞報道上説17年到18年的流感季是最糟糕的,所以我們就來看一下這一年的數據。CDC有一個非常完整的表格,列出了每年預測的數據。
過去十年裏,CDC預測美國死於流感的人的數據中,最低預測是1.2萬人,在95%置信區間。
數值為95%置信區間意味着如果在同樣情況下重複樣本分析(這回生成不同的數據集),95%的區間會得出符合(總體)情況的實際結果。這並不意味着真實數值的概率也在95%置信區間之內。
最高的一年是2017~2018年,預測有6.1萬人死於流感,去年則預測會有3.4萬人死於流感,因此到目前為止,假定預測6600人死於流感是比較準確的,對比歷史上來説的話,也不算多。
還有什麼是我們可能錯過的呢?
在新聞裏還提到:這是美國27年以來首次在線致命的乙型流感。我們照例用剛剛的步驟來驗證一下。
乙型流感的英文是influenza b。在網上搜索相關新聞,發現其實在好幾年前也已經有。所以這並不是27年來首次出現了乙型流感。
那麼這個標題到底是哪裏來的呢?我們需要更細緻的搜索。於是,我用了短語:influenza b back in 27 years ( 27年後乙型流感再度流行)。結果就有下面的新聞。
你會發現一篇關於艾荷華州出現27年未見的乙型流感的文章。(如下)
具體讀下去,你會發現27年是指乙型流感沒有成為predominant 流感病毒的時間。predominant 的意思是佔大多數的,主導型的。
所以並不是説27年內美國都沒有乙型流感,而只是27年內美國的乙型流感並不是它最重要的流感的來源。
查到這裏,我們已經發現了最早看到的報道里好幾個信息的誤區。尤其它的標題,容易誤導人們把預測當做事實。因此我們在對待這條信息上應該採取什麼樣的態度也就一目瞭然了。
所以,當你看到一些出乎意料的信息,你需要做的並不是盲目的去相信它,而是採用各種方式去驗證它。
畢竟很多時候,決策的錯誤並不是源於這個人本身決策機制和決策能力上的問題,而是源於他在信息收集上的麻痹大意。
人們對於信息收集上的認知有通常有三個來源:
1. 通過自己親身經歷得來。
但是這部分的信息可能因為受到人觀察力以及記憶力的影響而失真。其實,有各類科學研究表明人的記憶是相當不靠譜的,我以後會另外起一篇文章再做討論。
2. 通過第三方轉述得來。
第三方可能會犯各種錯誤, 比如關於美國流感,一些媒體轉述的新聞裏就有我們剛剛分析到的幾個問題:沒有注意到最早的來源CDC裏面用的是預測而把預測當做了事實;斷章取義,比如説在最初描寫美國可能遇到40年最糟糕的流感的文章裏都有説明這個流感有可能會趕上17年-18年那麼糟糕,但是媒體斷章取義的舍掉了後面的補充,那就會讓人認為這是美國40年來最糟糕的流感。
3. 通過自己研究和發現獲取信息。
這裏面也會有很多盲區。比如,在對一個話題不熟悉的情況下,一個人容易漏掉一些重要的背景資料。如果我們剛剛沒有去看歷史數據發現美國過去10年每年平均都有關於數千萬人感染上流感,幾萬人死於流感的預測, 那麼我們單獨去看6600人死於流感這條信息,感知就會大不一樣。
總結一下, 快速對信息進行驗證有三個步驟:
1. 搜索各類相關關鍵詞
2. 對比不同來源的信息內容和數據
3. 追溯到最早的來源,防止信息被取章斷意或者遺漏,或者錯寫。
只有對於重要的消息進行驗證,才能更好確保我們在決策上的正確性。這其實是自我認知三大塊裏面很重要的一個部分 -- 對自己獲取外界信息方式的認知。當我們具備這樣的認知,仔細看待類似美國流感這樣的信息時,一方面可以避免過度恐慌,但同時也提醒自己不要麻痹大意。畢竟這裏面的每一個數字都是一個個鮮活的生命。
最後,想補充一下,這篇文章裏面以比較理性的方式來看待這些數據。可是,每一個數字的背後都可能是一個很令人惋惜的故事。我沒有絲毫不尊重相關人員的意思,只是想純粹的從信息辨別真偽的角度來看待一下這個事情。
希望所有人都能平安度過目前的時期。
(完)