數人頭的科學方法丨混亂博物館_風聞
观察者网用户_241334-2019-03-28 10:21
某些歷史記載中關於人數的部分常常引起後人的爭議。比如一場青銅時代的戰爭有上百萬人規模、一次性殺死幾十萬俘虜,諸如此類。
不過這種有組織的軍事活動,大家還是願意通過各種辦法研究,真相總歸會越來越清楚。相比下,老百姓自發的聚集於廟會、燈會等場所,其人數就沒有那麼好待遇了。記錄者無非是用各種修辭和虛數誇大一番,數以千計、數以萬計、數以十萬計、揮汗成雨、集腋成裘,並不能提供任何有用信息。
我們發現似乎在過去幾千年裏都沒有人對這個問題產生什麼興趣。一直到現代以來,人數的展示,成為了一種極為重要的力量。晚至上世紀六十年代末,終於有人用科學的方法解決了這個問題。
-文字稿-
在古代,統計大波聚集者的數量似乎從來不是一個難題。數以萬計、遮天蔽日、恆河沙數等等,都是大家常用的計量單位。
進入現代,因為某些原因,統計羣眾規模才逐漸變成一個需要動腦子的問題。
1967年的某天,新聞學教授赫伯特·雅各布斯從辦公室的窗口向下望去,學生們正聚集在一起反對越戰。廣場的地面恰好被水泥伸縮縫劃分成許多大小相同的格子。
於是他挑出幾個站滿了人的格子,數出人數,計算每個方格內的平均人數,再用這個數字乘以方格總數,就得到了集會總人數的近似值。
簡單,有效。
甚至為了省去數人頭的功夫,雅各布斯還將人羣密度劃分為三個等級(鬆散人羣:1人/㎡,密集人羣:2人/㎡,非常密集人羣:4人/㎡),方便粗略估算。這是歷史上第一個有效統計密集人羣數量的方法,被稱為雅各布斯方法,相對標準誤差10%到20%。
在這之後,人們對雅各布斯方法進行了各種改進並沿用至今,但本質上講,和最初並沒有什麼不同,也就是説,分格子,數格子,然後加起來。
比如2010年,著名媒體人格蘭·貝克(Glenn Beck)在林肯紀念碑發動集會遊行,哥倫比亞廣播公司僱傭了一家叫DDIS(Digital Design and Imaging Service )的公司來計算參與人數。
他們首先繪製出劃好格子的3D地圖,在活動當天升起一個帶着攝像機的牽引氣球,從幾十米到數百米的不同高度、不同角度,拍攝活動人羣合成360度全景影像。
最後,DDIS將合成的影像覆蓋在3D地圖上,開始重複雅各布斯的方法:數格子裏的人數,相同密度的格子數,人數乘以格子數,得出總人數。
科技繼續發展,衞星圖像、GIS地理信息系統都被應用於統計集會人數。而通過機器學習,從監控圖像裏可以對個體進行識別,進而直接統計出人數;
人羣密集較大時,相互遮擋非常嚴重,更常見的方法還是通過提取圖像的Harris角點特徵,或者像素特徵,紋理特徵,建立圖像特徵和人羣密度的迴歸模型,進而得到人羣密度。
在統計人數這件事上,科技進步的本質,其實是訓練人工智能替我們數格子。
如果考慮人羣不斷移動,精確統計將更加困難。但解決辦法卻很簡單,那就是到羣眾中去,設置數據採集點。只有一個採集點的話可能會漏掉太多人。因此,更好的方式是……設置兩個採集點。
兩個點的研究人員分別記錄通過人數,並隨機採訪參與者,詢問他們是否通過另一個採集點。通過分析受訪者行為,可以推測出整個遊行隊伍的行為比例,進而修正數據中的錯誤。
至於為何不設置更多數據採集點,那是因為人們通過實踐發現,觀測點超過兩個,除了增加經費,對數據質量並沒有什麼幫助。
然而,更具有挑戰性的其實還是人類的屁股。
還是以2010年的林肯紀念碑集會為例,DDIS估算集會總人數為8.7萬,其他各方的估算的數字則相去甚遠。每一方都堅信自己的數字更加科學、準確。
可見,想讓人類在數格子時也保持理性,的確是一種奢求。
內容來自微信公眾號:混亂博物館,ID:chaosmuseum