外賣騎手的困局，算法不背這個鍋 | Alfred數據室_風聞

Alfred数据室-Alfred数据室官方账号-用数据看世界。微信公众号：Alfred数据室2020-09-09 16:13

2020-09-09

《人物》雜誌發表了《外賣騎手，困在系統裏》一文，文中從外賣騎手的視角出發，探究了目前外賣生態中外賣騎手送餐只能越來越快、越來越不顧自身安全的困局，引起大家對於外賣平台以及其所設計出來的算法的批判，並且在引言中發起一個思考：

數字經濟的時代，算法究竟應該是一個怎樣的存在？[1]

誠然，外賣平台作為這一切的最大利益獲得者，是造成外賣騎手困局的重要因素；但是如果試圖把責任推給算法，把解決外賣騎手困局的方法歸結於“加強程序員的培訓和價值導向”、“讓外賣平台所有的產品經理和算法工程師都去當一個月騎手”，那麼我們想説，數字經濟時代的算法不背這個鍋。

為什麼這麼説呢？

為了研究外賣平台所使用的算法，我們仔細閲讀了一篇由阿里本地生活智慧物流團隊發佈的論文**《Order Fulfillment Cycle Time Estimation for On-Demand Food Delivery》（外賣履約時間預估）[2]。**該論文首次比較系統地披露了外賣平台（餓了麼）目前採用哪些特徵如何設計算法來預估從顧客下單到外賣員送餐到顧客手上所使用的時間，被KDD 2020（數據挖掘領域頂級會議）接收為口頭報告論文。

且聽我解釋。

一、關於算法造成騎手困局的邏輯

《外賣騎手，困在系統裏》一文中透露出來的邏輯，或者説大家腦海裏關於算法造成騎手困局的邏輯是這樣的：

首先，算法根據歷史數據決定縮短配送時間，騎手為了避免訂單超時只好狂飆、逆行、闖紅燈，而騎手的這些舉動確實把實際送餐時間縮短了，產生了更多的短時長數據，算法根據這些短時長數據決定再縮短配送時間。這樣惡性循環讓騎手的配送時間越縮越短，算法讓騎手越來越陷入困局。

在這期間，算法只根據餐廳到顧客的直線距離決定騎手配送時間，而不管實際路況、天氣狀況、餐廳出餐時間、騎手等電梯時間。算法總是以儘可能縮短配送時間為目標。

是這樣的嗎？

二、算法的目標

首先，我們這裏所説的算法，指的是通過歷史訂單等各種數據，找出影響配送時間的因素及權重，以決定下一次騎手送餐時間長短的方法。

比如説，假如我們只把商家與下訂單者之間的距離作為因素，現有3個歷史訂單數據：1公里內配送時間為15分鐘，2公里為30分鐘，3公里為45分鐘，那麼我們根據這些歷史訂單數據就可以得出一個完美擬合曆史數據的算法模型：配送時間 = 距離 * 15。下一個訂單如果商家與下訂單者之間的距離是1.5公里的話，我們就可以使用這個算法模型預測騎手的配送時間為22分鐘30秒。

通過《Order Fulfillment Cycle Time Estimation for On-Demand Food Delivery》這篇論文（下稱論文）我們知道，餓了麼平台是通過設計一個深度神經網絡算法來預測訂單的配送時間。

它的做法是選擇很多影響配送時間的因素，使用歷史數據訓練一個深度神經網絡，試圖找到一組參數讓這個深度神經網絡算法預測出來的配送時間跟歷史訂單的配送時間最接近（也就是最小化算法的目標函數），這樣算法的預估配送時間就越準確。也就是説，這個算法的目標是如何讓算法更加準確地擬合曆史數據，而不是儘可能地縮短配送時間。

三、算法是受歷史數據影響的

上面説了，算法的目標是更加準確地擬合曆史數據，以準確地預測配送所需的時間，**所以毋庸置疑，算法是受歷史數據影響的。**歷史數據的結構性變動會影響算法的參數。

回到上面簡單的例子，假如現在平台上有兩名騎手，自願或者被動地加快了送餐速度，其中一名騎手送2公里的餐食只用了20分鐘，一名騎手送3公里的餐食只用了25分鐘，那麼對於算法來説，繼續使用【配送時間 = 距離 * 15】這個算法模型來預估送餐時間就已經不準確了，它可能會自動學習並調整為【配送時間 = 10 + 距離 * 5】，以更好地擬合新的數據。

這樣的話，看下圖可知大於1公里的距離，新算法模型的預測配送時間都縮短了。這就是騎手掉入困局的原因。

但是這是算法的責任嗎？不是的。假如騎手集體延長配送的時間，算法也會更改自身的參數去擬合新的數據，這樣新算法模型的預測配送時間都會延****長（當然這在實際中幾乎不可能發生）。

所以説，這並不是算法的責任，因為它天生的目的就是通過最小化目標函數來擬合曆史數據。那是誰的責任呢？我們後面再談這個。

四、算法預估配送時間採用的因素

想要準確地根據歷史數據來預測配送時間，就必須考慮到各種影響配送時間的因素，然後通過計算機來學習訓練出這些因素影響配送時間的權重。因此，餓了麼在設計算法時，從歷史數據中提取出了很多的因素，這些因素分為以下幾類：

1. 訂單信息：包括訂單的空間因素（用户、餐廳的座標，城市、配送區塊的ID等）、訂單的時間因素（小時時刻、是否工作日等）、訂單大小（菜品數量和價格等）；

2. 聚合因素：包括通過騎手手機的GPS軌跡等計算出來的聚合因素；

3. 菜品因素：比如説拉麪、披薩、火鍋等不同菜品的種類等；

4. 餐廳備餐時間

5. 供需關係因素：一是騎手的供需關係（騎手手上的訂單越多，送餐越慢）、二是餐廳的供需關係（餐廳手上的訂單越多，備餐越慢）；

6. 騎手因素：包括騎手到餐廳的距離、騎手目前手上未完成訂單數量、訂單送達剩餘時間等

7. 多維度相似訂單的配送段ETA：配送段預計到達時間即騎手到達用户目的地下車後，把餐食送到用户手中所用的時間，比如説包括騎手等電梯的時間；這部分時間的預估採用K近鄰算法找出與之維度相似的若干歷史訂單，計算加權平均時間；

8. 氣象因素：包括氣温、空氣質量指數、風速、天氣狀況等；

因此從上面所列的因素看，算法工程師在設計算法的時候，並非沒有考慮天氣狀況、餐廳出餐時間、騎手等電梯的時間。基本上影響外賣履約時間的因素，算法都考慮進去了。

那為什麼最後算法給出的預測時間，好像是沒有考慮這些因素呢？我們來看看論文中通過歷史數據提取這些因素進行訓練得出的每組因素的重要程度：

【注：這裏每組因素重要程度使用去除掉這組因素導致整個模型的平均絕對誤差（MAE）上升百分比來比較，如果一組因素去掉後模型的誤差上升越高，説明這組因素對於決定外賣履約時間越重要】

由表可知，訂單信息、供需關係兩組因素是影響外賣履約時間最重要的因素，而氣象因素、聚合因素、菜品因素是通過歷史數據學習到的、影響外賣履約時間最不重要的因素。

什麼意思呢？意思就是説：算法在設計的時候是考慮了氣象、騎手騎行軌跡等因素的，但是騎手通過實際的歷史訂單數據告訴算法，這些因素對於配送時間並沒有太大的影響。

但是怎麼會沒有影響呢？高温天氣、暴雨天氣，騎手們的送餐時間跟平常沒什麼區別，原因是什麼呢？就是騎手們為了避免超時，風裏來雨裏去嘛。

五、責任在誰？

現在我們從算法角度來總結一下：算法的目的是準確預估配送時間，它受歷史數據的影響，也考慮了多種因素來預估配送時間。所以説，數字經濟時代，算法是沒有錯的。

那麼到底是誰造成了騎手們的困局呢？**這就得回到這個循環，從是誰縮短了騎手的配送時間説起。**在這裏，主要的參與者有外賣平台、騎手和用户三者，我們明白，三者都是逐利的（這無可厚非）。

其中外賣平台是逐利的，因此它會人為地縮短騎手的預計配送時間，利用算法的特性把這個無限循環惡化的遊戲玩起來；

騎手也是逐利的，大家都想接更多的單賺更多的錢，所以一開始的時候就有一部分騎手不遵守交通規則開始逆行、闖紅燈以縮短配送時間，這迫使算法預估配送時間變短、越來越多的騎手不得不開始逆行、闖紅燈，殊不知就這樣劣幣驅逐良幣，開始陷入惡性循環；

用户也是逐利的，大家都想要在更短的時間內拿到外賣，於是對外平台和騎手的配送時間提出了要求。

所以説，對於騎手的困局，外賣平台、部分騎手、用户三者都是有責任的（當然最大的責任方在外賣平台）。唯有算法是任人打扮利用、專門背鍋的小姑娘。

六、如何破解困局？

那麼如何破解目前的這個困局呢？有人説騎手團結起來建立一個工會就能解決，有人説要讓外賣平台跟騎手簽訂勞動合同，這些從不同領域的角度出發的方法或許會有效果，可以留給專業人員去討論，我們不討論。

然而甚至有人説要加強程序員的培訓和價值導向？試想一羣程序員參加完價值導向培訓之後回到辦公室，加班到凌晨2點，第二天9點之前又通過釘釘打卡來上班，領導批評説模型產生的實際效益還不夠好，再把騎手的預估時間縮短幾分鐘吧，不然你們這個月的績效就別指望了。這多魔幻現實主義呀。

那麼到底如何破解困局呢？在****我看來，這還得看這場遊戲中到底誰在獲利誰在虧損。

外賣平台通過這個遊戲提高效率，肯定是獲利的；部分騎手一開始是獲利的，但是大家都為了時間不顧生命危險拼命趕單時，便是虧損的；用户享受到了非常便捷快速的外賣服務，也是獲利的。

還有誰呢？還有就是社會大眾。騎手為了省時逆行闖紅燈，社會大眾徒增了很多道路交通安全上面的危險，是虧損的。涉及到社會大眾的問題，使用屬於大眾的公權力來解決是一個合理的選擇。

面對外賣平台，需要有監督和懲罰機制，當重罰也被列入考慮因素的時候，便能迫使平台去規範自身的行為；

面對騎手，上海推行的電子馬甲騎手扣分制，便是一個思路：每個騎手必須穿上印有編號的電子馬甲，一個季度內扣完36分不允許再上路。

面對用户，平台應該給予騎手對於用户給差評的申訴機制，以及騎手和用户之間的雙向評分機制，避免用户無理要求以及隨意給差評。

至於算法，不管是不是數字經濟時代，關鍵的都不是算法，而是資本和人。

引用：

[1] 人物.外賣騎手，困在系統裏[EB/OL].https://mp.weixin.qq.com/s/Mes1RqIOdp48CMw4pXTwXw,2020-09-08.

[2] Lin Zhu, Wei Yu, Kairong Zhou, Xing Wang, Wenxing Feng, Pengyu Wang, Ning Chen, and Pei Lee. 2020. Order Fulfillment Cycle Time Estimation for On-Demand Food Delivery. In Proceedings of the 26th ACM SIGKDD Conference on Knowledge Discovery and Data Mining USB Stick (KDD ’20), August 23–27, 2020, Virtual Event, USA. ACM, New York, NY, USA, 10 pages. https://doi.org/10.1145/3394486.3403307

本文首發於微信公眾號“Alfred數據室”。