「我是為數據去的京東」對話京東供應鏈首席科學家申作軍_風聞
谭婧在充电-谭婧在充电官方账号-偏爱人工智能(数据、算法、算力、场景)。-2019-12-06 12:05
2019年11月20日,京東零售集團智能供應鏈Y業務管理部供應鏈開放日,美國加州大學伯克利分校工業工程系主任,京東供應鏈首席科學家,申作軍教授做了題為《大數據驅動的自動補貨系統研究》的公開演講。科技新媒體《親愛的數據》主編,譚婧,就機器學習技術如何在京東供應鏈場景裏的應用,現場請教了申教授幾個問題。
《親愛的數據》:演講中您提到,機器學習技術在做端到端的預測時,把供應鏈管理中的幾個步驟忽略掉了,比如銷量預測,補貨預測。這樣做會不會更粗糙了?應該怎樣理解?
申作軍教授:這個問題問得非常好,其實不是忽略掉了。供應鏈上存在信息歪曲的情況,這個就跟日常生活中傳話一樣,比如A跟B説一句話,B跟C傳話,C再跟D傳話,這個過程中信息會發生扭曲,而機器學習技術不會,機器替人類把數據的特徵提取出來。
以前智能供應鏈系統是「分步走」式的決策流程,現在京東使用的是「端到端」補貨決策模型,關鍵是避免了預測誤差在決策中的放大。端到端補貨決策模型的實質是,銷量預測+VLT預測+補貨決策用一個模型做出來,最後做到了自動下單。
《親愛的數據》:基於機器學習技術的端到端補貨決策模型,看上去省略了“分步走”式的決策流程,做到了“端到端”,但是,供應鏈上每一層的數據依然很重要吧?
申作軍教授:你説得很對,每層的數據都得采集,而不是忽略數據。在人為估計的情況下,最開始估計的時候有可能就估計錯了,後面就越錯越多。需要強調的是,我們的端到端是一步解決了預測和決策兩步,並不是跨越多層供應鏈的端到端。
不是説忽略中間數據,這些數據我們都採集,而且京東有能力採集到這些數據。比如庫存管理,估計今年雙十一能賣多少,數據會符合一個分佈。但是,有可能一開始估計的時候就錯了,供應鏈各個階段就會越錯越離譜。最終,雙十一庫存管理環節的成本就會變高。
《親愛的數據》:京東之前是“分步走”,現在是“端到端”,供應鏈過程裏的“經驗”,是讓機器自己去學習、自己去提取特徵?
申作軍教授:對。你理解得非常快。
《親愛的數據》:您認為機器學習技術如何賦能京東供應鏈管理?
申作軍教授:這個問題非常好,也非常大。
機器學習在其他領域的應用進展很快,AI是一定要打進供應鏈的。機器學習對於複雜系統是一個非常好的工具,供應鏈就是一個複雜系統。今天,京東的管理,對機器學習技術的應用是剛需。拿京東自營的產品來説,商品數量已達540萬,如果我們不用機器學習和人工智能的方法,僅僅憑採銷人員的經驗和Excel表格,管理的精度和效率永遠做不上去。
下一步我們想做的工作有很多,其中一個是做一個傻瓜式的庫存系統,京東可以幫助小店智能補貨。比如你去街邊的小店買東西,一進店就會問“老闆,啥啥啥有沒有?”店主可能直接回答你“沒有”。因為這種店商品品類少,可能就只有300個SKU,庫存管理做得還很差。你應該聽到過,現在智能家居場景會提到的,一台智能冰箱可以自動幫一個三口之家智能補貨,提醒主人該去買雞蛋了。京東的技術幫助小店融進供應鏈系統裏來,賦能他們,幫助他們做好生意。
《親愛的數據》:這個庫存管理工具是toB(企業級服務市場)的思維嗎?
申作軍教授:都有。對企業級(toB)、對消費端客户(to C),京東都可以做,只要有數據,京東的機器學習技術可以幫你智能化。
《親愛的數據》:您剛才談到的是線下實體商鋪的例子,在線上如果將機器學習技術的產品應用於京東平台的所有商鋪,有數萬家,他們的管理能力上去了,相當於京東平台的管理能力極大的增長了。
申作軍教授:對。亞馬遜公司有一塊業務叫FBA(Fulfillment By Amazon),就是利用先進的管理技術和手段,幫助小店提高管理水平。今天的京東一定要做賦能,在京東平台上,預測、配送、庫存,都可以做智能化的管理,比如補貨的工具,就可以用到我剛才提到的端到端的自動補貨系統。
《親愛的數據》:京東正在做,還是打算要做?
申作軍教授:京東現在已經在做增強平台能力,但是目前僅停留在和大的品牌廠商合作的層次上,並不是厚此薄彼,而是因為現階段人力和資源有限,這也是我們急需AI算法的另一個原因。
《親愛的數據》:傻瓜型,也就是通用型的,工具給所有的商鋪使用,要大家都滿意的結果。
申作軍教授:對,這就是我們AI算法想要達到的目標。
《親愛的數據》:研發週期會有多長?
申作軍教授:只要我們這個團隊一直做,應該很快。一到兩年內應該能研發出比較好效果。這也是個持續優化的過程。自研技術工具幫助商鋪進行數據分析、產生判斷。工具給出的決策和結論,店主可以參考,或者自己去調整。慢慢成熟了之後,精度會越來越高。
《親愛的數據》:京東的零售供應鏈數據是全中國最全面的,其他友商在這塊不具備。這個現象不能武斷地定論誰好,誰壞,各家各有特色。按道理,京東在這麼好的數據基礎之上,再利用機器學習這個工具,能創造出更高的價值,京東就有了獨特的競爭優勢。可以這樣理解嗎?
申作軍教授:你説得非常對,京東有零售供應鏈最全面的數據。很多友商沒有全面的數據,也沒有一體化的決策系統。如果只是一個平台,供應鏈的很多環節沒法做到整體優化。但是,京東不一樣,京東可以全鏈條的優化,為什麼我要在京東推“端到端”,因為我推得動,所有數據都有,都可以打通,其他友商就比較困難。
《親愛的數據》:能不能説您加入京東是為了「數據」?
申作軍教授:是。我想做更有意義的事情,其它電商的侷限性使我沒法做供應鏈深度的優化。
《親愛的數據》:掌握了全鏈數據之後,京東供應鏈還有哪些地方值得去做優化呢?
申作軍教授:我也思考供應鏈優化的重點在哪裏。在京東這個生態平台上,可以優化的空間非常大,物流、運輸、庫存等方面,信息的共享可以產生很多降低成本的地方。舉個例子,我倆都賣同樣的東西,我倆地理距離又很近,你有100件庫存,這時候,我正好缺貨。我付錢,買你的庫存。但是如果信息不連通,我不知道缺的庫存正好在你那裏,還要再次從遙遠的地方進貨,時間成本,物流成本都增加。這只是一個很簡單的例子,如果能設計好數據和庫存共享機制,優化好,就可以從雙贏到多贏。
《親愛的數據》:聽您的講解,我理解供應鏈的鏈狀結構,在向網狀結構發展。我理解的對嗎?
申作軍教授:沒錯,供應鏈不應該叫供應鏈,該叫供應網絡。最早學術界研究供應鏈的時候,從研究庫存開始,那時候是點到點的關係,所以叫做“鏈”。現在的供應鏈其實都是一個網絡的,但是如果沒有足夠的數據分享,這種網絡結構的供應鏈的優勢很難體現出來。

《親愛的數據》:能不能説,今天當京東這種角色出現了,網絡裏的信息才能夠更好的傳遞,這樣效率才能高。可以這樣理解嗎?
申作軍教授:對,有了信任,才可以更好的做這件事情。
《親愛的數據》:當擁有了開放數據平台,京東就是一家大數據公司。之前有很多數據和信息是看不到的,拿到了數據,就能提高效率,可以這樣理解嗎?
申作軍教授:對的,一旦建成了大平台,數據共享之後,降本增效的機會就出現了。但是,能否拿到數據?這是一個挑戰。
《親愛的數據》:作為技術驅動型的公司,和美國電商亞馬遜比較,京東的技術優勢如何?
申作軍教授:2017年,京東喊出,未來12年,京東只有三樣東西——技術、技術、技術,堅信所有業務必須建立在技術之上。京東推行ABC與XY(A就是AI,人工智能,B是bigdata大數據,C是cloud雲計算),並且在美國硅谷建有一個200多人的辦公室。我的同事都是特別優秀的人才,來自MIT、Stanford、UCBerkeley、Georgia Tech、Michigan等美國知名高校。他們願意在京東這個平台上做一些非常前沿的事情。
競爭是難免的,我們內部也經常和亞馬遜做對比。我今天講的《大數據驅動的自動補貨系統研究》只是硅谷辦公室參與生產的眾多成果中的一個。另外,我們還做了很多數據驅動供應鏈管理方面的研究,不少結果也是業界領先的。

《親愛的數據》:如何做到比亞馬遜預測還精確?
申作軍教授:只要我們利用好京東生態圈的高質量高深度更全面的數據,我們完全可以做得更好。
《親愛的數據》:能否再具體地介紹下?
申作軍教授:目前還是商業秘密。
《親愛的數據》:能不能理解為,京東是做電商業務起家的,多年積累了豐富的業務知識,數據質量又非常好,促進了算法效果的提升?
申作軍教授:對。現在是弱人工智能時代,人工智能一定有人機協作,不能只靠機器學習技術,第一,很慢。第二,人的智慧為什麼不用?比如京東有很多做產銷的資深人士,擁有多年業務經驗,知道什麼時候需求會上,什麼時候會下。所以,我們會把人的經驗加進機器學習的模型裏面去,業務知識好好的發揮作用,機器學習模型的效果會更加好。
圖為,京東美國硅谷辦公室
《親愛的數據》:能不能説京東在硅谷的研發團隊是一個望遠鏡?
申作軍教授:對,我對研發團隊的定位是,不要追着業務跑,而要帶領着業務跑,做深度的研究,體現研發的前瞻性。把學術界特別優秀的知識成果吸收進來,再跟我們京東的業務去結合。硅谷這個團隊精英非常多,京東在硅谷是跟Facebook(臉書)、谷歌去搶人才的,有了人才才能做一些供應鏈前瞻性的研究。
《親愛的數據》:有沒有發表過頂會論文?
申作軍教授:有。我們硅谷研發中心發了很多論文,很多發表在頂級期刊和會議,比如頂級學術會議KDD(知識發現與數據挖掘),就發了差不多十篇論文。
申作軍教授,作為京東供應鏈首席科學家,在演講中多次提到產研結合的親身體會。人工智能技術的應用激勵着人工智能學者向本質問題挑戰,而這些本質問題恰恰不是一個純學術實驗室環境能遇到的,本質問題常常生於工業界。申作軍教授説,“翻閲大量庫存管理的文獻,發現有用的並不多。反而在攻克困難的過程中,既發展了思路,又開拓了視野。”
歷史上,任何一次新技術的爆發都帶來了超乎想象的新商業和經濟模式,而人工智能技術是一種“嵌入式”技術,誰擁有了場景,就佔領了新技術應用的高地。因為人工智能技術要進入某一垂直領域,就急需相關領域的知識和數據。無論京東的零售、物流,還是金融裏都不缺少知識和數據。產研結合成為京東技術進化史重要的篇章,中國科技巨頭京東正在敞開胸懷,利用人工智能技術大幅提高生產效率,讓實踐成為檢驗AI 的唯一標準。
(完)
附錄(論文):
AutoNRL: Hyperparameter Optimizationfor Massive Network Representation Learning
Ke Tu, Jianxin Ma, Peng Cui, Jian Pei,Wenwu Zhu
Efficient and Effective Express viaContextual Cooperative Reinforcement Learning
Yexin Li, Yu Zheng, Qiang Yang
Off-policy Learning for Multiple Loggers
Li He, Long Xia, Wei Zeng, Zhi-Ming Ma,Yihong Zhao, Dawei Yin
Tackle Balancing Constraint forIncremental Semi-Supervised Support Vector Learning
Shuyang Yu, Bin Gu, Kunpeng Ning,Haiyan Chen, Jian Pei, Heng Huang
Unifying Inter-region Autocorrelationand Intra-region Structures for Spatial Embedding via Collective AdversarialLearning
Yunchao Zhang, Pengyang Wang, XiaolinLi, Yu Zheng, Yanjie Fu
Urban Traffic Prediction fromSpatio-Temporal Data using Deep Meta Learning
Zheyi Pan, Yuxuan Liang, Weifeng Wang,Yong Yu, Yu Zheng, Junbo Zhang
Conditional Random Field Enhanced GraphConvolutional Neural Networks
Hongchang Gao, Jian Pei, Heng Huang
ProGAN: Network Embedding via ProximityGenerative Adversarial Network
Hongchang Gao, Jian Pei, Heng Huang
Multi-Horizon Time Series Forecastingwith Temporal Attention Learning
Chenyou Fan, Yuze Zhang, Yi Pan,Xiaoyue Li, Chi Zhang, Rong Yuan, Di Wu, Wensheng Wang, Jian Pei and Heng Huang
Deep Uncertainty Quantification: AMachine Learning Approach for Weather Forecasting
Bin Wang, Jie Lu, Zheng Yan, HuaishaoLuo, Tianrui Li, Yu Zheng and Guangquan Zhang
TrajGuard: A Comprehensive TrajectoryCopyright Protection Scheme
Zheyi Pan, Jie Bao, Weinan Zhang, YongYu and Yu Zheng
UrbanFM: Inferring Fine-Grained UrbanFlows
Yuxuan Liang, Kun Ouyang, Lin Jing,Sijie Ruan, Ye Liu, Junbo Zhang, David Rosenblum and Yu Zheng

