專訪葛鼕鼕:我們做華人該有的求解器,BAT和國內科研單位做不了_風聞
科工力量-观察者网原创视频栏目-欢迎关注“科工力量”微博、微信公众号2018-06-27 16:44
2018年4月,商務部聯合中國物流與採購聯合會等8個部門聯合下發《關於開展供應鏈創新與應用試點的通知》,在全國範圍內開展供應鏈創新與應用試點。隨着物流行業的快速發展,提高效率、降低成本也成為了企業和政府部門共同關注的熱點和極力追求的目標。
杉數科技是一家依託於世界領先的深層次數據優化算法和複雜決策模型的求解能力,致力於為企業提供解決方案的人工智能決策公司,成立短短不到兩年時間內,杉數科技不但獲得了國家高新技術企業、中關村高新技術企業等多項榮譽,也於今年5月獲得了‘中國創業企業新苗榜年度新鋭企業’的稱號。
日前,觀察者網科工力量專欄採訪了杉數科技聯合創始人、上海財經大學教授葛鼕鼕。葛鼕鼕告訴記者,像求解器這種業務,BAT做不了,國內別的科研單位更做不了。在這個領域裏,杉數科技在技術上有一些事情可以保持壟斷。

科工力量:運籌學的工業應用,主要有哪些方向?
**葛鼕鼕:**在OR(Operations Research)之外,美國的工學院有個工業工程industrial engineering的方向,商學院有個叫運營管理OperationsManagement的方向,這些就代表了一些交叉的方向。
IE(IndustrialEngineering)這塊在工業生產中有相關的一些概念,比如排程調度。舉個例子,像華為、上汽這些大型工廠,它的某個車間怎麼去規劃,每個機器該幹什麼事情,每個工人應該幹什麼事情。不光是工廠,比如説醫院裏邊手術該怎麼排能夠讓病人的等待時間縮短,或者讓資源的利用率提高。所以排程不只是工業生產,健康管理裏也可能用到。
剛也提到,(美國的)商學院一個主要的方向叫Operations Management,就是運營管理。運營管理這塊基本上涉及到企業方方面面的管理工作,最典型的是供應鏈,供應鏈的每個環節,可能都會用到所學的東西。比方説收益管理,包括物品的定價、服務的定價、勞動力的定價,這些問題怎麼做到智能化、科學化、精確量化,這是各個企業廣泛面臨的問題。現在有很多平台,上面聚合了各種資源進行運作,比如一個物流平台,它上面一個物流服務的動態定價,再比如機票的定價,我們看到的始終都是變動的,這些我們都叫收益管理。
定價後邊就是庫存,比方説最基本的,你可以看到在一個大的體系下,消費者拿到製造商的生產出來的產品,但在基層,收到需求再組裝按照流程製造等一系列事情,排程調度就是做這些事情。
生產出來以後它經過供應商發貨到大倉,大倉再到地區倉,地區倉可能再到前置倉,最後到消費者手裏去。經過了一個多級的倉儲體系,這裏頭每一級倉庫都會面臨一個問題,“預期什麼時候庫存不夠需要補貨”,就是觸發了一個什麼紅線以後我就知道我要補貨,要補多少貨,要從哪個倉調撥。這個是庫存管理,inventory management。
這個東西本身就是運籌學裏最經典的問題。當然還有相關的問題,比如説賣汽車的他開店開在哪,這個叫location,也是選址問題,這也是運籌學裏的經典問題。
還有物流,比方説我怎麼送,快遞員的路線該怎麼跑,倉庫裏的檢貨員路徑該怎麼跑,車輛該怎麼跑,導航該怎麼導航,規劃路線,甚至説倉庫裏邊的機器人應該怎麼跑,都跟這個相關。涉及物流問題的企業像餓了麼、美團都非常重視這個事情,京東這些,(庫存管理)是他們的立身之本。像亞馬遜這種企業它有幾百個OR方向的PhD都在做這些事情。
當然你大而廣之地講,它(運籌學)本身還可以做很多事情,比方説從國家戰略角度來講,像石油勘探之類的行業,用一些優化的技術,可以讓勘探成本下降非常多。再比如説像整個國家電網、南方電網的實時調度、定價這些事情,比如有個電站突然出事了,旁邊的電站可能需要增大輸電量,怎麼增加,哪些電站增加,以什麼樣的方式運行。這些可能的突發情況,你要對其做出反應就要用到(運籌學)的。
還有一個就是金融行業。比方説現在炒的很熱的智能投顧。根據歷史數據去分析,對你的資產做一個調配,做一個合理的配置。可能用到預期收益、預期風險、股票這些信息和它們之間的相關性,把這些輸入模型以後,去做一個自動的計算,算出來你的理想投資方案。這些其實背後用的一些,我們叫作非線性規劃,或者叫二次規劃的一些數據模型的求解,有很多時候是用運籌學的軟件在做。
我能想到的可能暫時大方向就剛才提到的這些。有排程,有供應鏈的各個環節,有國家戰略角度,再有金融領域等等。當然肯定還有軍事等。
科工力量:你們這個求解其實是通用的,還是説不同行業的模型不一樣?
**葛鼕鼕:**我舉個例子,像我剛才説金融,它的場景跟其他的場景可能看起來都不大一樣,但最後寫這個模型無非就是解一個數學的東西,這個數學模型本質上(跟其他行業)是一樣的。實際上在黑箱子求解器上面可以衍生出很多垂直的場景,這些場景看上去差別很大,但本質上相通。你建模的時候,可能各有各的約束,目標也都不一樣,但一旦劃定數學語言都到黑箱子裏面求解以後,數學上Mathematically是非常相似的。我的博士論文是做一個航空的問題,剛開始我做背景調查課題沒發現,後來做了2年以後發現跟別人的一個醫學圖像的問題重複了,這兩個風馬牛不相及的東西壓根就沒想到會出現重複,最後2年的功夫很多白費了。
科工力量:下一個問題,你們建立的初衷是什麼?包括為什麼你們準備自己開發這個求解器?
**葛鼕鼕:**有兩個想法,一個是我們的導師葉老師(注:斯坦福大學終身教授葉蔭宇)他覺得華人應該有一個自己完全獨立的的求解器。另一方面就是作為一個商業公司,你的核心競爭力要體現出來。你説做供應鏈做金融,基於已有的求解器,你做各種垂直場景,這誰都能幹。但你既然有這麼一波在算法求解方面最優秀的人才的話,你為什麼不把這部分資源利用起來,去做一件中國人一直沒做好的事情,去做一個自己的求解器呢?一方面是利國利民,另一方面也是利於公司獨特性。
科工力量:如果用國外的求解器,是不是中國人的數據是要給他們的?
**葛鼕鼕:**看你怎麼選。你選擇雲服務的話可能就要交出去;你也可以選擇直接把軟件拿過來離線用。但離線是有很多缺點的,你買了一個license,這個軟件完全是一個黑箱子,一方面他怎麼做你完全不瞭解。另外一方面是,有些時候你需要做一些個性化的定製,可能如果你能打開做一個定製的話,算法速度能提個10倍100倍都很容易,但他不給你打開。
將來我們的這個東西,雖然對外也是需要保持黑盒子的狀態。但是有一些行業,有特殊性的時候,我們會做針對性的改造。相當於這個盒子是半打開的。
科工力量:開發的難點是在什麼地方?數學原理我想應該差不多。
**葛鼕鼕:**原理很經典,都是經典的,但是最大一個問題就是説,你像國外比較成熟的,像IBM的Cplex,像美國的Gurobi,他們都是積累了30年以上經驗了,就是説他基本原理有了。就算給你一個東西,或者做一個東西,做一個命題,有了大概的骨骼了,但這個東西它的皮膚是什麼樣的,肉是什麼樣的,其實你還是不知道。你就知道這個骨骼,這個人應該長這個結構。所以其他這些東西需要長期的摸索,你要看看這個人,你才知道這個人體應該怎麼去塑造。國外的機構他們做這個求解做了30多年,積累了很多經驗,每一個環節都優化到了不能再優化的地步。但我們現在只有一個很梗概的算法,裏頭每個細節怎麼實現更高效率,你其實不清楚。所以就是説,一方面你需要對數學的原理和算法非常瞭解,另一方面你得有行業經驗的積累,知道怎麼去寫一個高度工程化、達到真正商業水準的軟件。
這些工作需要非常好的編碼能力和經驗,同時又要求對數學非常瞭解。目前來看,兼具這兩個事情的開發者非常少,全世界加起來華裔就個位數。
科工力量:行業特徵反而不是最重要的,可以這麼理解嗎?
**葛鼕鼕:**對求解器來説吧,垂直場景是什麼並不重要,關鍵是編碼的能力和經驗以及歷史上累積下來的經驗。
科工力量:求解器是不是像深度學習,你的數據越多,就越容易推進?
**葛鼕鼕:**經典的求解器能求解很多模型,包括線性規劃、非線性規劃,這些模型可能求解的方法都不一樣,但在現實中,90%以上場景你用到的可能都是(線性規劃和整數規劃)。像我剛才舉的例子,除金融以外的場景,90%以上其實就是線性規劃和整數規劃,這些東西主要取決於你算法寫得怎麼樣,跟數據無關。
比方説,現在有許多大規模的非凸優化問題,不再是一個線性規劃問題了。雖然深度學習的很多技巧是從運籌學進化到現在這樣的,但是深度學習的一些技巧、用途和深度學習的算法是能給我們帶來啓迪的。從整體上來説,在求解器來説,在工業實踐中能用到的那部分,實際上90%以上是不需要數據的,是獨立存在的。
科工力量:我們再講一下你當時是怎麼説服那麼多人回來做這件事情的?
**葛鼕鼕:**2年時間,公司現在已經有70、80人,最開始的時候,只有我們四個創始人,我跟王子卓(CTO)都是做這行的,本身對這個行業比較瞭解,也非常有激情,許多的人都是我跟王子卓叫回來的,我們四個創始人,加上CEO、CPO這些,都是我們當時的同學,大家都覺得這個事情比較有意義,從商業角度講也比較有實現價值,所以很容易談攏。後面招募了一些新人,過去一兩年,擴張到80人,這裏頭有近一半左右是海歸。這些海歸我覺得有很多也不是我們勸回來的,海歸回國工作現在其實是很平常的一個事情,國外現在形勢對中國人找工作其實也不是很有利。當然還有一些是靠號召力,比方説我們求解器的開發團隊,裏頭大多數人都是葉老師號召他們回來做些有意義的事情。
科工力量:你剛剛説了運籌學在物流定價系統上的一些應用,因為中國的移動支付特別發達,有滴滴、順豐、京東、美團、餓了麼這些企業,是不是中國在運籌學的應用上,會有優勢?
**葛鼕鼕:**很大程度上説,中國的很多事情其實在美國沒有發生,比方説餓了麼這種,美國的飯館,店家有自己的外賣團隊,你打個電話就給你送來,就是説就是在線了,但它可能還是餐廳自己的外賣團隊給你送,這時候你產生一個巨無霸來統一這個事,並不容易。
我們覺得這種後發,可能也是我們一個機會所在。這也是我們的一些觀察,中國的一些企業,比如現在出現了一個新的商業模式,大家有了,他就有了,所以新的商業模式可能很快能夠主宰這個行業,這是很有可能的。
另一方面,從運籌學本身能做的事情來講,可能美國有很多,在美國,大型公司都有optimization department,優化的部門專門來做。比如供應鏈的優化,像亞馬遜、波音,以前我給他們工作,他們有一個很大的優化部門,能力很強,把公司很多環節優化得很好。但中國很多體量很大的公司,基本上這一塊都是空白,所以這是機會所在。因為很多公司可能確實戰略重心或者説公司的業務特點決定了,它不是很願意花很大一個成本去養一個團隊去做這個事情,而更願意靠外部力量來做。
科工力量:現在中國這些企業,他們會不會有種心理是覺得,還是憑經驗做會比這樣用運籌學的方法來做優化要好?
**葛鼕鼕:**我們也打交道了很多企業,確實有很多企業最開始的時候會有這樣的疑慮,這個時候我們只能去做一些實際的測試來打消他的疑慮,證明你的方法確實比他的直覺更好。
我經常講一句話説,科學往往是反直覺,你不能過於相信直覺,相信經驗。
舉個例子,比方説我們曾經幫公司做一個定價,在節日的時候,他擔心這個節日過完了東西賣不出去。他會靠直覺去採用降價策略,認為可以薄利多銷。
但我們分析就會發現,比如這個節日你針對的消費主體是年輕人,他對價格並不敏感,這時候你本來賣10塊錢的東西,降到8塊他也會買,提到12塊他照樣會買。在這種情況下,你降到8塊,可能銷量增加了20%,但是利潤就被壓縮很低。但你把他提到12塊,可能損失了20%的銷量,但是利潤可能就翻番了。
很多時候,業務員可能意識不到這個問題,所以頻頻降價。
我們就通過測試去説服他。測試發現,如果這時候反而你提價,利潤會急劇增加,那他可能就會被説服。
科工力量:網上有一些爭議,比如攜程等公司大數據殺熟,你們會怎麼看待這個問題?
**葛鼕鼕:**我們上課講定價策略經常舉一些有趣的例子,有些機票或者旅館,你訂的時候只要把設置稍微一變,系統往往就會把這個顧客的分類改變,那個價格就會發生極大的變化。對任何一個商家而言,只要它能拿到一定的歷史數據,或者從模型分析殺熟是永遠存在的一個選項,過去幾十年來,從美國到中國,全世界的公司都有這個選項。
問題在於,在這個選項下,他要平衡什麼樣的因素,比如説他是把顧客滿意度放在第一位,還是把利潤追求放在第一位。在這個階段如果企業自己沒有調整好,比方説顧客滿意度,和追求更高的利潤之間的這個平衡點他沒選好,就會出現一些問題,比如你提到的這種批評的聲音。從專業的角度來講,我覺得這個現象本身不奇怪,它説到底就是算法或者模型不夠完善,沒有把人類的行為習慣和心理模式的影響計算進去的問題。
科工力量:能不能舉例説明一下,你們的產品能夠給企業帶來哪些改變?
**葛鼕鼕:**比方説我們曾經參與了某個出行平台的分單系統。最開始的時候是説,直接派單給離得最近的司機,2015年的時候他們開始考慮,每個切片的時間點上,怎麼在整個城市範圍內通過決策實現一個均衡狀態,讓所有人的滿意度儘可能地最大化。
到了2016年的時候他們會考慮通過運營調度、激勵機制、價格變動去實現削峯填谷。讓任何一個派單的決定,對未來能夠產生一個更積極的影響,而不是隻考慮切片的那一秒鐘全局的優化。
從這個事情你可以看到中國的企業成長的速度非常快,從開始什麼都不懂,到變成可以做到全空間的全局優化,後來可以做到整個時間軸上的優化,進化很快。
科工力量:他們會把你們要做的事給自己做掉嗎?
**葛鼕鼕:**我覺得,企業有不同的類型,有一些企業會希望什麼都自己來做,但總會有另一些企業是希望把一部分事情外包出去的。另一個問題在於,即使是想自己做,有些事情高到了一個門檻,企業是沒法自己做的。像求解器這種業務,BAT做不了,國內別的科研單位更做不了。所以在這個領域裏面,技術上你有一些事情是可以保持壟斷性的。
科工力量:你們現在離國際水平還有什麼差距?
**葛鼕鼕:**我們打交道過的很多企業,現在看來他們在某些自己深耕的領域上已經達到國際最好的水平,比如我們斯坦福團隊曾經跟京東一起合作開發的無人倉調度系統,這個系統冬奧8分鐘還曾經出場,幾百個機器調動的很快,很高效。確實已經是一個全球範圍內的領先水平。但也還有一些領域,比如説求解器這個東西,我們確實跟國際水平有差距,能做的事就是儘快把這個差距彌補掉或者縮短掉。
我們公司本身從理論上講的話,跟國際水平沒太大差距,因為我們也僱了很多國際上有名的科學家,像斯坦福、NYU等一些名校,他們的教授在幫我們做事情,國際上發生什麼事情,我們也瞭解,像我們CTO王子卓30歲就已經是明尼蘇達的終身教授了,也擔任了很多國際上最好的期刊的編委或者領域編委,更不用説葉老師這種國際上也是泰斗的,對於這些動向其實我們都很清楚。你説跟國際水平有什麼差距,還真沒什麼差距,但是中國運籌學跟工業結合的這個問題上,過去這些年一直沒做好,可能也是國內不注重運籌學的關係。所以我們理論結合實際這方面確實和國外有差距,這兩年這個領域新興的公司都在努力去彌補這個差距,追趕的速度很快,但目前還是有很大的差距。
科工力量:最近有個概念是“中國製造2025”,您覺得運籌學在當中能發揮什麼作用?
**葛鼕鼕:**整體上,在製造業的發展中,我們不是要扮演一個很敏感的角色,但是我們確實是一個非常重要的角色。你造不出來的我們沒有辦法,但你能生產出來的,從組織流程上,我能讓你更高效。比如説一個巨大的汽車工廠,甚至華為這種,他的生產排程;或者物流公司,車輛調度的系統,本來就是手動去排,可能排幾個小時,排一天都很正常。有了系統後,他可能幾分鐘給你出一個非常科學的規劃了,這是很顯著的一些提升。
科工力量:現在德國人講工業4.0,裏頭涉及很多概念,包括智能製造,或者説自動化,你説的這個通過算法來優化工業流程是不是扮演了一個類似的角色?
**葛鼕鼕:**工業4.0的智能製造這個東西用我們業務上的話説,就是人、料、系統三者之間,儘可能快地達成匹配。它需要幾個要素,一個是信息化完備,不能原料沒送來,而且你不知道這個事情,就直接把機器開動了。要把類似“原料送沒送來”這些信息集成化、標準化,這些事情其實還沒涉及到算法,就已經挺麻煩了。
我們做的事情呢,就是把這些事情做好之後,對整個系統的優化、科學化、效率最大化工作。這些是我們可以做的事情,如果沒有前面信息化的這些環節,後端這些就都做不了。(但)如果你這塊做不好,同樣會對你整體效率產生非常大的負面影響。
科工力量:按這個標準來看,中國現在很多企業是不是還停留在2.0,甚至3.0時代?
**葛鼕鼕:**我懷疑很多企業可能還在1.0時代。至少從我們看到的來説,有很多企業非常落後,信息化都還基本沒實現。
科工力量:是不是發達國家的水平已經到了你們扮演的角色出場的時候了?
**葛鼕鼕:**有很多國家有很多企業做的很好,但也不是每個企業都這樣。資源需要好好配置,排程需要更科學。這個不是我的臆測,事實上就是如此。
科工力量:我們下一個問題是你們為什麼要做開源求解器?
**葛鼕鼕:**我們求解器的開發是兩個方向,一個是説我們以學校為主題做一個開源的Leaves算法平台,主要考慮就是説希望能激發大家的興趣,提高我們科研團隊的影響力。也給大家提供一個科研的工具。另外一個呢,我們團隊內部有一個非常成熟的開發團隊在做商業版的求解器,這個版本未來一兩年內我們就會公佈。這個版本對國內教育來説肯定還是免費的,但對商業用途肯定以後要收費。
科工力量:葉老師曾説過深度學習本質上就是個非凸優化問題?
**葛鼕鼕:**我不是專門研究深度學習的,我對這個事情理解本質就是一個非凸優化問題。從數學結構上講,非凸優化是一個比較困難的問題。數學意義上,他就是一個非常大規模的求最優解問題。但這個問題很難解,所以大家要設計各種各樣的算法來求解。從計算機,從運籌學,從統計學的角度,大家從各個角度去嘗試,幾個社區互相啓發互相激勵,能取得一些進展,但那個機理徹底弄清楚,到目前為止還是一個未解之謎。
所以很多時候,它能把問題解決得比較好,但原理是什麼説不清楚。像銀行很多時候,利用數據去做一些模型來做風險控制,他會需要一些解釋性強的模型,需要知道每一步模型的意義何在,每一個變量意義何在,這樣他才能指出可能的風險會出在什麼地方。但你像深度學習這個模型,他看不出來風險在哪裏,他不知道你每一步操作的意義何在,所以很多時候,金融行業就會出現沒人敢用你的深度學習模型的困境。你要真用,效果還可以,但是會不會出大簍子,沒人知道。
科工力量:你們會做人工智能這一塊的東西嗎?
**葛鼕鼕:**我們做了很多人工智能的事情,就像比如我們做無人倉裏機器的調度,跑來跑去,大家肯定覺得算人工智能的事情。但在這個問題裏,我們把他分解成為三步。每一步都是運籌學裏面大規模優化的問題,所以你説到底是運籌學項目,還是人工智能的項目。就像剛才説的深度學習本質上是一個非凸優化,一旦叫優化,優化就是運籌學,優化就是運籌學的核心。在這個時代,人工智能這些概念的邊界都是模糊的,你很難説清楚。
科工力量:但是人工智能這個概念這麼火,你們為什麼不把自己往這個方向靠?
**葛鼕鼕:**我們做了很多人工智能的事情,但我們還是堅信我們沒必要去蹭這個熱點。有時候我們也需要跟人去講説,我們是個與人工智能非常相關的公司,但是我們有自己的特色,運籌學、求解器這些東西,任何時代都是國家和社會需求的,你把這些事情做好,他也需要一些工匠精神,也能實現商業價值和學術價值。
科工力量:你們做這個開發需要跟外面合作嗎,有什麼業務上需要合作的?
**葛鼕鼕:**我們公司的開發工作主要是兩塊,一塊是求解器的開發,基本上是我們獨立在完成。這是一個我們從長遠計,希望不求回報慢慢去做好的事情。另一方面我們需要針對各個場景,比如説物流的場景、庫存的場景、定價的場景,不停地開發出一些輕量化的系統解決方案。這些東西是需要跟實際結合來快速迭代的,所以會非常需要和外界的交互。基本上還是以我們自己開發力量為主在運作。
科工力量:我的意思是,這些場景相當於一個生態,如果讓外面的人一起參加進來,你們的生態會不會作用變得更大?
**葛鼕鼕:**在我們的規劃裏面,現在已經有了一個雛形的平台cardinal optimization platform,我們把這個平台稱為“杉數智慧鏈”,就是以求解器為底層,上面由各個場景共同構成的供應鏈的管理平台,我們希望能通過這種中立的系統解決方案的平台讓大家都參與進來,達成一個雙贏的局面,我們為大家提供便利,大家為我們提供數據驅動算法的進化。
目前我們正在籌備的2018“第二屆AI大師圓桌會”,邀請了很多學術和業內頂級的專家們,主題就是為了探討供應鏈行業未來的發展形勢。對供應鏈管理與優化感興趣的人都可以來聽聽。