用CHIP2013數據庫和統計局2019年數據,再分析一下可支配收入分佈_風聞
西西弗评论-西西弗评论官方账号-西西弗评论在这里更新优秀文章2020-06-09 17:12
文/老C
1、
前面討論了兩篇文章,研究了一下中國的可支配收入的數據。
週日註冊了一個論壇會員,下載了CHIP2013的數據庫。
CHIP2013中的可支配收入是按照户統計的,一共是17244户的數據。
每户的人口數量不一樣。但詳細統計的人頭上需要做表之間的勾連,我自己時間有限,就不仔細去分析了。
這1.7萬户的收入均值是55348元。假設每户3人,人均收入均值是18449元。這個和2013年國家統計局公佈的18311元的人均可支配收入的數字是比較一致的。
1.7萬户中,收入最低的是負的15.85萬元,最高的是196萬元。
小於等於零元的共有85户。佔0.49%
户可支配年收入小於1.8 萬元(月收入小於1500元的)共有 2754户,佔15.97%
户可支配年收入小於3.6 萬元(月收入小於3000元的)共有 7317户,佔42.43%
户可支配年收入小於5.4 萬元(月收入小於4500元的)共有 9130户,佔54.95%
户可支配年收入小於7.2 萬元(月收入小於 6000元的)共有 13058户,佔75.72%
户可支配年收入小於10.8萬元(月收入小於 9000元的) 共有15420户,佔89.42%
户可支配年收入小於18萬元(月收入小於1.5萬元的)共有16832户,佔97.6%
CHIP2013年户均可支配收入中位數是:42225元。以户為單位的月收入是3519元。
按五等分户:
低收入20%的户年收入均值 12412元
中低收入20%的户年收入均值 27379元
中等收入20%的户年收入均值 42470元
中高收入20%的户年收入均值 64014元
高收入20%的户年收入均值 130445元
2、
2013年-2019年,六年來,我們國家的居民可支配收入是否上漲了呢?
2013年我國國內生產總值568845億元,人均大概41900元。2019年我國國民生產總值990865億元,人均7.08萬元。人民幣計價的人均GDP上漲 69%。
而這六年,根據國家統計局的官方數據,收入均值和中位數都上漲了超過60%以上。
那麼,低收入和中低收入羣體的可支配收入是否增長了呢?
這個相對複雜一點。
2013年,國家統計局的收入五等分統計是分城鎮和農村分配統計的,沒有合併數字。而2019年,是合併統計的,沒有分開的數字。但可以估算一下。
CHIP數據中也有按户的五等分數據,可以假設一户=3人,也可以估算一下。
2013年全體居民中最低的20%,以農村人口居多,大致是農村的低收入和中低收入組。均值在4000左右比較合理,應該不超過5000。CHIP 2013數據是4137元,算是合理
中低收入的20%,也會以農村居多,大致是農村的中等收入組+農村的中高收入組和城市低收入組的一部分,在9000-10000左右也是合理的。CHIP 2013 數據是9126元,算合理。
基本上,最低收入20%和中低收入的20%,在2013-2019年之間的絕對收入增長在50-80%,應該是一個非常合理的預計。
CHIP2013的户均年收入中位數是42225元,而統計局2019年人均可支配收入中位數26523元。如果一户=3人,户均可支配收入中位數約為7.8萬元,增長80%左右。
3、
下面,我們比較一下CHIP2013 (2013年的統計數據)和北師大/財新的數據,以及浙商證券的數字。
北師大的數字
浙商證券的數字
如果假設一户3人。(CHOP20131.7萬户的收入均值是55348元。2013年國家統計局公佈的18311元,基本上户均收入=人均收入乘以3)。
就是把户均月收入0-1500元,和人均月收入0-500元放在一起。會發現,在低收入羣體佔比,北師大和浙商這兩個所謂2019年的數據,比CHIP2013年的的佔比還高。
2013年,CHIP2013數據户均月收入低於1500元的比例是15.97%。
六年後的2019年,人均月收入低於500元的比例,北師大/財新數據是15.81%,浙商證券的數據是17.8%
這個就有點荒謬了。
北師大/財新 和 浙商的數據意味着從2013年到2019年,中國的收入最低的15%的人口,六年來的絕對收入完全沒有增長。中低收入的20%,收入增長也很低,這是完全不合理的。
浙商證券的測算,2019年,收入低於500元的人口比例,比2013年還要高?這個不合理吧!
人均月收入1000元以下(户均3000)的比例,CHIP2013 為 42.43%,北師大/財新數據為39.1%,浙商數據位39.4%。
人均月收入1500元以下的比例,CHIP2013 為 54.95%,北師大/財新數據為56.52%,浙商數據位54.8%。
2013年的數據,居然和2019年的數據,分佈上沒什麼區別?這有點太荒謬了吧。
按北師大/財新和浙商的數據,人均月收入中位數都落在1000-1500元區間,都低於1500****元。這一點和國家統計局的2019年可支配月收入中位數 2210元也完全不符合。
4、
這裏面有一個可能,就是低收入羣體的户均人數遠大於高收入羣體。
比如,如果0-1500元月收入的户,户均人數是正常的1.5-2倍。那麼,0-1500的户均收入就應該對應 0 - 250 或 0-300元人均收入這個分類,而不是0-500元。
人均收入低於1000元,應該對應户均收入低於5000元,而不是3000元。這樣,在2013年數據中,人均收入低於1000元的佔比就是對應户均收入4500元或者6000元。
這樣,人均收入低於1000元的比例,才會從2013年的55-75%,下降到2019年的40%左右。
然而,這樣還是不太對。
如果2013年人均收入低於1000元的比例大於50%,人均可支配收入中位數應該在12000元以下。
而統計局2013年的數字是,人均可支配收入均值為18449元。中位數應該在15000元以上,低於12000元的可能性非常小。
5、
如果户均人數沒有顯著差異,那就是北師大/財新 和 浙商證券應該犯了錯誤。
那在什麼地方犯了錯誤呢。
我這邊猜測一下。
浙商的算法有註明,是用了CHIP 2013年的數據庫,加上國家統計局的五等分數據做調整,把2013年數據調整到2019年。但怎麼調整就沒有詳細説了。
但2013年,國家統計局的五等分數據是沒有全國的,只有分城鎮和農村的。
我猜測可能犯了一個如下的數據處理的錯誤:
分析師直接把城鎮低收入和農村低收入算了個加權平均。把這個做為五等分的低收入均值收入,然後和統計局2019年的五等分收入做對比。
這樣算的結果是,低收入羣體13年的加權平均收入是7339元,13-19年,6年的收入幾乎是零增長。
再把這個增長率代入到CHIP2013年的數據集,就得出了2013年到2019年,中國的收入最低的15-20%的人口,六年來的絕對收入完全沒有增長這個荒謬的結論。
從而最終得到了一個錯誤的收入分佈。
為什麼五等分數據不能直接做城鎮和農村的加權平均?這個顯而易見吧…..
6、
《金融時報》也發了一篇文章。
金融時報這篇文章寫得還是不錯的。但還是存在一個比較明顯的錯誤。人均月收入1000元處於35%的水平,這個推斷是錯的。
文章使用的是2019年《中國住户調查年鑑》中2018年的數字。其中,中等偏下户,月均每月1177元收入。中等偏下户是收入排名在20-40%的户。這部分户的平均收入是每個月1177元。
在全體居民的收入統計中,由於頭部1%的用户的收入非常高,收入均值都比中位數偏高。比如CHIP2013數據中,户均年收入中位數是42225元,均值是55348元。
但如果對中低收入羣體來説,因為不存在高收入的1%,均值和中位數是比較接近的。
比如CHIP2013數據中,低收入(底層20%)的户均年收入均值是12412元,中位數是13487元。中位數大於均值。(因為存在負收入的户拉低了均值)。
中低收入(20-40%)的户均收入是27379元,中位數是27274元。中位數和均值幾乎一樣。
金融時報文章中的結論,月收入1000元在全國的水平是35%,是肯定錯誤的。排名20-40%的用户的月均收入是1177元。怎麼可能排名在20-40%的用户,有15%低於1000元,只有5%高於1000元呢?
2018年的數據,月均收入低於1177元(20-40%組均值)的人口比例應該在30%左右。月均收入低於1000元的,應該在25%的總人口,大概3.5億人。即使稍多一些,也不應該超過30%,就是4.2億人。
如果我們用2019年的統計局的數據,更新一下。
低收入組(0-20%)的年收入是7380元,月均收入615元。
中低收入組(20-40%)的年收入是15777元,月均收入1314元。1314元應該是30%的水平
月1000元應該在20-25%這個範圍內。2019年,中國低於1000元月收入的人口,應該在2.8 - 3.5億人之間。