較較真兒,扒一扒《月收入不足千元,這6億人都在哪》這篇文章_風聞
西西弗评论-西西弗评论官方账号-西西弗评论在这里更新优秀文章2020-06-09 14:12
文/老C
1、
5月30日,在總理記者招待會後,我寫了《關於總理説的:“6億人月收入也就是1000元。”》這篇文章。用我自己的理解,解釋了一下6億人月收入1000元的問題。
我的觀點是總理説的”6億人月均收入也就是1000元的意思,應該是中國收入最低的6億中低收入人口的平均收入,大概處於1000元左右的水平。” 而不是有6億人的收入都低於1000元。
6月3日,財新雜誌的觀點(Opinion) 專欄刊發了由北京師範大學中國收入分配研究院撰寫的《月收入不足千元,這6億人都在哪》這篇文章(以下簡稱”該文章“)。
當時看完後,我覺得裏面數據比較古怪,當時挑出了文章中的一個明顯錯誤。文章中引用的美國的人均可支配收入(税後)的數字,比人均税前收入還高
微博上隨便説了一句,感覺這篇文章硬傷比較多,就沒再理會。
但隨後,這篇文章在網絡輿論場上開始流傳。《財新》在6月6日再次登了一篇記者撰寫的文章,引用了這個數據。
網上也有質疑的文章,但大多數都集中在家庭人均月收入超過2萬,只有70萬人這個數字上,覺得不可能這麼少。
有朋友也在網上問我,説這個文章的結論,和你説的不一樣呀。裏面説月收入低於1090元的人就有6億之多。
那我今天就較較真兒,雖然對方是國字頭的“中國收入分配研究院”,是國內研究收入分配最權威的機構,而我是個業餘寫文章的自媒體。
2、
中國收入分配研究院的這篇文章的數據來源語焉不詳,只是説了一句“北京師範大學收入分配研究院課題組分層線性隨機抽取了7萬個代表性樣本”,對這7萬個樣本的抽取時間,抽取方法都沒有詳細表述。
文章多次提到國家統計局,給讀者一個印象,就是數據來源和國家統計局有關,但國家統計局的官方數據和該文章的數據有明顯不一致的地方。
財新6月6日的文章,也引用了國家統計局的官方數據。
統計局的數據,按全國居民五等份收入分組,低收入組人均可支配收入7380元,中間偏下收入組人均可支配收入15777元,中間收入組人均****可支配收入25035元,中間偏上收入組人均可支配收入39230元,高收入組人均可支配收入76401元。
財新文章的數據沒錯,但結論錯了。中等偏下户的月均收入1315元,而不是中等偏下户所有人的月均收入都低於1315元,這是一個基本概念性錯誤。
假設中等偏下户這20%的羣體的月收入中位數和月收入均值一致,應該是有30%的人口,也就是4.2億人的收入低於1315元,而不是5.6億人低於1315元。(因為收入最高的羣體會拉高均值,整體人口的收入均值肯定大於中位數。但是中等偏下的這20%羣體中沒有超高收入人口,可以假設中位數和均值相差不大)
中等偏下户和中間收入户之間的分界,應該是在(1315+2086)/2 = 1700元左右。按國家統計局的官方數據,應該是大約5.6億人的收入低於1700元,這5.6億人的收入均值應該在(1315+615) / 2 = 965元左右。
這個結論,和我之前文章中寫的,中國最低收入的6億人,收入均值在1000元左右。是一致的。
3、
收入研究院的文章數據,和國家統計局的數據,另一個明顯不一致的就是收入中位數
該文章的數據中,1500元收入以下的人口總百分比是 0.39 + 15.42 + 14.43 + 8.86 + 3.75 + 0.37 + 13.30 = 56.52%。1500元以上的人口總百分比是 12.13 + 14.81 + 11.21 + 4.52 + 0.56 + 0.05 = 43.48%。
可支配收入中位數,是排位在50%的人的收入。按這個數據,肯定是低於1500元/月的。大致估算。1100-1500元收入有13.30%。假設均值和中位數一致,大概有6.65%的人大於1300元。這麼估算,大概派位在50%的人,月收入應該是1300元左右,年收入 1300 * 12 = 15600元。
然而,國家統計局公佈的2019年,全國可支配收入中位數是 26253元,月均 2188元。比該文章的1300元左右,高出了 59%。
這麼大的差異,很難用誤差解釋。
要麼國家統計局的數字是錯的,要麼收入分配研究院的數字是錯的。
4、
做統計有句話,rubbish in, rubbish out。發現有奇怪的地方,首先看數據來源。百度一下中國收入分配研究院 和 7萬個樣本兩個關鍵詞,基本上找出的都是這篇文章。
於是,我就去了中國收入分配研究院的官網。
官網首頁中就有,中國家庭收入調查(CHIP),在30年內做了5輪調查。
在進入CHIP的首頁,裏面寫着,為了追蹤中國收入分配的動態情況,中國家庭收入調查(CHIP)已經相繼在1989年、1996年、2003年、2008年和2014年進行了五次入户調查。它們分別收集了1988、1995、2002、2007和2013年的收支信息,以及其他家庭和個人信息,分別編號為CHIP1988、CHIP1995、CHIP2002、CHIP2007和CHIP2013。
Wait a second, 裏面寫的最後一輪調查是在2014年進行的,收集了2013年的收支信息。
點擊進入CHIP 2013,裏面是這麼寫的,CHIP2013的樣本來自國家統計局2013年城鄉一體化常規住户調查大樣本庫。後者覆蓋全部31個省(市、自治區)的16萬户居民。CHIP項目組按照東、中、西分層,根據系統抽樣方法抽取得到CHIP樣本。樣本覆蓋了從15個省份126城市234個縣區抽選出的18948個住户樣本和64777個個體樣本,其中包括7175户城鎮住户樣本、11013户農村住户樣本和760户外來務工住户樣本。
64777個個體樣本,這個數字和7萬個樣本,似乎很接近了。
在整個中國收入研究院的網站,我沒有找到任何2014年之後新的關於7萬個樣本調查的資料。
5、
OK。該文章7萬個樣本,和CHIP2013 64777個樣本之間有沒有關係呢?
那讓我們回頭看看2013年的數據。
2013年,全國人均可支配收入18311元,但沒有給出可支配收入中位數數據,只給了城鎮和農村分開的中位數數據。
農村人均比中位數高12.5%。城鎮人均比中位數高 11.4%。按這個估計,全國的可支配收入的中位數大概應該在 16000元-16200元之間。每個月1330-1350元。
這個數據,和我根據收入研究院的這篇文章的數據,推算出了可支配收入中位數在1300元左右,是非常一致的!
因此,我有理由懷疑,北京師範大學中國收入分配研究院,這個中國收入分配領域研究的權威機構,在2020年6月撰寫,財新雜誌刊發的《月收入不足千元,這6億人都在哪》文章,使用的是CHIP2013的64777個樣本的數據。根本不是像文章中表格中寫的2019年的數據。
所謂2019年的數據,只是用了2019年總人口14億的數字。裏面的收入數據和收入分佈都是2014年收集的2013年的數據!
2013年,只有70萬人,家庭人均月收入大於2萬,有6億人家庭人均月收入低於1090元,這個很合理,畢竟是6-7年之前的事情了。
但現在已經是2020年了。
不是不可以用2013年的數據,但如果真的用了2013年的數據是否應該説明一下!而不應該在表格裏寫,本表是2019年數據。
CHIP2013,是目前我國對外公佈的,最完整的收入調查數據。
使用這個數據無可厚非。
但是,如果用了CHIP2013的數據,應該説明,這個數據是2014年收集的2013年的收入數據,並非最新的2019年的數據。
特別是做為優秀的權威媒體,做為國家級的權威的研究機構,在如何披露使用數據上應該更為小心謹慎。
在這篇文章已經廣泛傳播的今天,我認為《財新》和文章的作者,有責任站出來澄清一下,用的數據到底是2019年的,還是2013年的?
如果確實是2019年的數據,能否説明一下數據來源和獲取方法。解釋一下為什麼和統計局的官方數據,有如此大的差異?到底誰錯了?
6、
無論是,我的結論 - 收入最低的6億人,人均月收入1000元,還是該文章的結論 - 有6億人月收入不到1000元。其實都反映了我國還是一個發展中國家的現實,我們還需要走非常漫長的路。
東西差距,貧富差距,城鄉差距,都非常大。這些絕大部分人都承認。
然而,事實就是事實。不應該為了立場曲解事實。
自媒體為了流量,不夠嚴謹,時而誇大,時而瞎寫,也就罷了。
但做學術研究,特別是國家的權威學術機構,還是應該對自己有更高的要求。7萬個樣本的來龍去脈,有責任和大家説清楚。如果真的是2013年的數據,寫成2019年是絕對不應該的。
做為嚴肅媒體,也應該給自己提更高的要求。除了對數據來源應該更多的驗證。基本邏輯錯誤不能犯。一羣人的月均收入1315元,和這羣人的月收入低於1315元,根本不是一回事兒。