聊聊深圳機場:推算「病毒式營銷」效果的方法能用來推算病毒傳播情況嗎?_風聞
李及李-李及李数据分析公司创始人-数据驱动,分析导向, 为航空和汽车竭尽全力。2021-06-21 09:27
文 | 李瀚明一李及李
昨天有在深圳工作的朋友請我幫忙,問能否評估深圳機場病毒可能的擴散程度。
這是一個經典的機場商業問題的意想不到的應用。我們時常在市區看到提着機場免税店袋子的人。在深圳的情況下,袋子變成了可能攜帶的病毒。商業界所稱的「病毒式營銷」,這一次是李鬼遇上李逵——真正的病毒來了。
第一步:人流量——有多少人路過了這家店?
在機場確診的這位姑娘,在一家名為「厲家菜」的餐廳上班。這家餐廳在哪裏呢?在這裏(高德地圖提供):

在深圳機場的各登機口當中,除去東南角國際線一面,西南角一面,中央兩側,這家店位於前往剩下的三條指廊的必經之路上,是非常好的位置。
深圳機場的登機口大體均勻分佈在十個面上:
指廊 登機口編號 數量
東南(國際) 1-9 9
西南 14-19 6
中央 20-26 7
東北 27-38 12
北 39-50A/B 13
西北 51-62A/B 14
厲家菜餐廳的位置通往約 39 個登機口,佔總體的 75%。加上部分中央登機口的旅客可能會來食用,實際覆蓋在 40 個以上。
**那麼,會路過這個斷面的人流也就可以計算或者分析得出了。**一般而言要快,可以估算;要準,可以用機場內 Wi-Fi 信號推算。實際情況中,一般是兩者結合,可以對路過這家店的人做出一個準確的估計。
深圳一年國內線客流量 4500 萬,一天是十萬人左右。從這些登機口離開深圳的旅客佔到約 70% 到 80%,在七萬人左右的水平。
那是不是 10 天總共有七十萬名密切接觸者呢?那不一定。因為在機場商業的故事中,還需要考慮轉化率。
第二步:轉化率——有多少人進去坐了?
**在這個案例中,轉化率是可能被這位服務生感染而被列入密切接觸者名單的人的比例。**不妨將這個問題稍作簡化為「進了店吃飯的人的比例」乘以「吃飯期間剛好是這位服務生服務」的比例。
**有心人可以發現,這一比例和很多因素相關:例如最典型的時間、消費水平等。這要乘以一個係數。**以這家餐廳的價格(人均 100 元左右)和風格(北京菜)而言,百分之五到百分之十就已經不錯了(飯點可能略高)。當然,我們也可以通過 Wi-Fi 或者人臉識別等手段拿到更精確的測量數據。
再考慮一下當天的服務生排班,重點找出這位同事的時間點,可以進一步乘以 30% 左右(一般而言服務生 5 人,每位客人接觸 1 到 2 名服務生計算)。
那麼我們現在有 70000 乘以 30% 乘以 10% = 2100 人。十天總共有最多 21000 人。
21000 人的密切接觸者還是不太好找,尤其是他們還分散在全國各地的情況下。
第三步:用户畫像——吃了飯的人最有可能飛去哪裏?
我剛剛提到了這家餐廳的兩個特徵:
它是一家主打北京風味的餐館;
它的價格在深圳機場範圍內處於中上水平。
那麼什麼樣的人會進去吃呢?這是典型的用户畫像匹配問題,只不過是倒過來用——以前是「已知用户性質求行為」,現在是「已知行為求用户性質」。
所謂的用户畫像,實際上就是計算概率。這家店的旁邊剛好有一家「潮汕傳人」。可以有預見的是,不同的用户會在這兩家菜之間做出傾向不一的選擇——倘若你要飛到北京,你選厲家菜的概率是多少?假如你要飛到上海呢?這就是計算一系列的條件概率。
我們在這裏需要用到貝葉斯定理:我們知道旅客當中吃了厲家菜的人數(吃了厲家菜的概率——剛剛的轉化率),也知道旅客飛到上海的人數(前往上海的概率——由每日航班離港旅客統計可得)。我也知道假如一位旅客要飛到上海,他會吃厲家菜的概率(基於人口學分析得出),那麼我們是可以用貝葉斯定理推算出,假如一位旅客吃了厲家菜,他隨後飛到上海的概率。
當然,在這一次案例中,除了運用概率算法進行估計以外,通過對在餐廳門口的監控配合各登機口區域的監控進行同一人匹配,我們還進行了驗算。通過估計和驗算,我們可以得出這 2100 人大概都去了什麼地方,會出現在哪一班航班的登機口。
第四步:宣傳效應——吃完飯的人會不會和其它旅客分享?
我們還必須考慮一個因素:旅客可能會在吃完飯以後和其它旅客「宣傳」這家餐館——在這個案例中,就是旅客還沒離開深圳,直接在登機口就把另外的旅客傳染了。
這種情況毫無疑問可能發生:最近廣東處在「龍舟水」,航班有着不同程度的延誤,旅客會逗留在登機口區域一段時間等候航空公司的指示。這意味着人數可能多於我們的判斷。當然,這也是可以估計、驗算的。
最後一步:精準觸達——向旅客發短信吧。
在機場商業的例子中,估計了旅客的用户畫像以後需要向旅客推銷這家餐館;而在這個疫情防控的案例中,就需要通知這位旅客向居委會報備密切接觸者了。
這毫無疑問需要一些平衡——如果進行極大規模(總共七十萬人規模)的撒網,可能需要通知全國大量兄弟省市,成本就會非常高了;因此,在這個時候對問題的準確估計,是很有必要的。
由於我和朋友之間的君子約定,我不能公開任何結論。但是,這種基於數理統計的快速方法,在最後取得了和人臉識別人工篩查幾乎相同的成績。
因此——學好數理化,防疫我不怕(笑)。最後祝各位朋友身體健康,早日低風險 :-D。