淘寶數據問題 我從曲線擬合角度簡單説説_風聞
此地不宜久留-2019-11-13 17:21
我就是餘亮説的工業情懷黨,工程師出身,一貫不喜歡現在媒體,小編,還有文科生。
淘寶數據這個事情,大家一看到什麼三次項擬合度達到99.99%,第一反應就是數據造假,這就是不懂數學建模,不懂函數擬合,不懂S曲線的毛病了,這就是為什麼我一貫討厭現在很多煽動型自媒體及其追隨者,蠢還不學習,一被忽悠就上當,精神世界一點點辨別力和防線都沒有。
S曲線,是一個常用的曲線模型,可以用於用户預測,收入預測,產品生命週期,技術週期,城鎮化水平,甚至人的體能等等好多東西。簡單來説,就是一個事物的發展,有幾個時期,緩慢成長期,加速期,降速衝頂期,衰退期,比如你以小黃車為例子,按照天為單位,把用户數畫一個曲線,你會發現一個正態曲線,左半部分就是S曲線,右半部分的衰退可能很快甚至是斷崖,但左半部分,一定是S曲線。


那麼從成長期到加速器,迅猛增長的東西,很多可以呈現指數函數,包含有自然常數e,而e的本質物理意義就是最高效率的增長,不同指數函數,不同在e與時間軸的在函數式裏面的不同位置,還有參數的不同。
任何一系列歷史數據,都可以做函數擬合,畫出一條吻合度非常高的曲線來,尤其這種比如收入增長,用户增長,帶有一致特徵的數據。然後你就得到一個曲線函數,裏面有幾個參數。
這幾個參數,就包容了過去這段時間各種因素,比如宏觀環境,經濟,競爭,人的需求,政策等等吧,全部被參數包容了。
然後你就可以預測了, 就是把時間軸拉長,繼續用這個函數和你已經得到的參數來計算。
那麼,假如未來幾年,宏觀環境沒太大變化,繼續保持這個勢頭增長,那麼很當然的,你的預測和實際達成吻合度會非常高,這一點都不奇怪,而且你計算的東西,樣本數越大,基數越大,越容易準確,所以你會看到今天阿里的人出來澄清,提到了美國GDP和生豬, 這兩個例子都不錯。
那麼是不是參數就一直準確呢? 不是, 當宏觀環境大幅度變化,趨勢就會變化,這就是S曲線的拐點,過了拐點,就變成冪函數或者對數函數, 就不能再用原來的指數函數預測了。但是很明顯,阿里現在還沒到拐點,從一個側面也説明,在電商需求這塊,仍然在迅猛增長,再深一層,説明我國內生動力還很充足,沒有受貿易戰很大沖擊以至於影響到需求變化。
就這些吧,希望文科生能看懂。以後不要想當然的瞎下結論了。
順及, 指數增長,S曲線, 正態曲線,再向下就是正弦曲線,這個世界,有很多客觀規律的。
正如易經所言,潛龍勿用、見龍在田、終日乾乾、或躍在淵、飛龍在天、亢龍有悔,任何事物的發展都有階段的。
20191113