岳希明、李实:我们更应该相信谁的基尼系数?
岳希明,李实
发表时间:2013-1-23 9:28:00    最近修改时间:2013-2-23 12:11:55
摘要: 2013年1月18日国家统计局公布了2003年至2012年全国居民收入的基尼系数。据此可知,全国的基尼系数在2003年为0.479,之后逐年连续上升,到2008年达到最高点的0.491,其后几年有所回落,到2012年降为0.474。众所周知,此前不久, 西南财经大学中国家庭金融调查中心根据其住户调查计算并公布2010年全国居民收入差距的基尼系数,数值为0.61。也许正是先有了西南财大的基尼系数(“先入为主”的缘故),国家统计局公布的基尼系数受到了一定的质疑。面对这种情况,我们究竟更应该相信谁的基尼系数呢?
关键词:基尼系数,收入差距

    2013118日国家统计局公布了2003年至2012年全国居民收入的基尼系数。据此可知,全国的基尼系数在2003年为0.479,之后逐年连续上升,到2008年达到最高点的0.491,其后几年有所回落,到2012年降为0.474。众所周知,此前不久,西南财经大学中国家庭金融调查中心根据其住户调查计算并公布2010年全国居民收入差距的基尼系数,数值为0.61。也许正是先有了西南财大的基尼系数(“先入为主”的缘故),国家统计局公布的基尼系数受到了一定的质疑。面对这种情况,我们究竟更应该相信谁的基尼系数呢?对此,我们想结合多年从事收入分配研究的经历,对两个机构公布的不同基尼系数的准确性和可信性给予评价,目的在于促使整个社会对基尼系数和我国居民收入差距现状形成一个较为客观的认识。

 

1. 如何看待国家统计局公布的基尼系数?

从总体上来说,如果在两个机构公布基尼系数之间加以选择的话,我们更加相信国家统计局公布的结果。从估计的误差上看,我们认为国家统计局基尼系数的误差会更小一些,因而也是基本可信的,可以接受的,其理由如下。

基尼系数估计得是否准确,主要取决于样本是否具有代表性和收入指标的统计是否全面和准确。保证样本的代表性,除了抽样要有科学方法之外,同时要保持足够大的样本量。无论在抽样上,还是在样本量上,国家统计局的住户调查都占有比较优势。国家统计局的样本量是西南财大的10倍以上,而且国家统计局的样本覆盖了中国大陆的所有省份和超过1/3的市县。从收入指标统计上的全面性和准确性上看,国家统计局通过日记账方式收集样本户收入和支出信息,比西南财大采取的一次性回忆的数据收集方法更为准确。更重要的是,统计局住户调查详细地收集了农户各种粮食作物产量等信息,因此对农户自产自用农产品收入的估计十分准确,这一点是以往其他住户收支调查难以做到的。

当然,我们并不认为统计局的住户调查没有任何问题,其主要的问题是在样本代表性和收入指标统计上。具体地说,由于高收入人群的不配合,统计局城镇住户样本缺少有代表性的高收入住户样本,住户样本中高收入户的代表性偏低。不仅如此,由于城镇住户收入来源的多样化和某些收入的隐蔽性,城镇住户样本的收入可能被低估,而且越是高收入户,低估的程度可能越高。城镇住户样本中高收入户的缺失以及现有样本中收入的低估,直接导致对城镇内部收入差距的低估、城乡之间收入差距的低估和全国收入差距的低估。这确实不是中国独有的问题,是世界各国都面临的问题。为了解决这个问题,也出现了大量的研究文献。当然这个问题更加困惑着国内的统计人员和研究人员,因为中国的问题比其他国家更为复杂和严重。为了纠正城镇高收入样本的偏差问题,虽然统计部门和民间研究人员做出了一些努力,但是结果并不令人满意。

为什么高收入人群的收入难以调查清楚呢?我们知道,高收入群体的收入分为两类,一类为合法收入,一类为非法收入,包括灰色的、黑色的、黄色的、白色的等等。对于合法收入,虽然也存在低报的问题,但是通过其他的信息(如其财产和经营方面的信息)还可以对其做出一个大体的估计。而对于非法收入,统计部门和调查机构往往是无能为力,也许要借助于司法部门才能搞清楚。而很多对统计局基尼系数质疑所援引的根据是频繁而又数额巨大腐败案的出现。如果说统计局的基尼系数没有反映非法收入,这种质疑是有道理的。但是这里的问题是,让统计部门去收集贪官收贿和其他各类非法收入确实是勉为其难了。笔者记得曾在一次研讨会上向统计部门建议应该解决非法收入的统计问题。一位长年从事统计工作的参会者半开玩笑地说:“统计贪官收入可不是统计局的事,那是中纪委的事。” 实际上,即使是中纪委和司法部门对那些隐藏的,没有暴露的腐败分子的非法收入也搞不清楚。

为了修正高收入人群样本偏低的问题,这次国家统计局在估计基尼系数时使用了国家税务总局年所得12万以上纳税人个人所得税自行纳税申报信息。这说明此次公布的基尼系数已经对高收入进行了部分调整。当然这部分人的收入基本上属于合法的高收入,它在多大程度上能够反映高收入人群收入水平还有待于进一步考证,这不仅依赖于把这部分样本纳入基尼系数计算时的操作细节,更重要的是取决于国税局掌握的年收入12万元以上纳税人的信息对我国高收入人群的整体收入状况是否具有代表性。

总之,尽管统计局住户调查数据仍然存在一定的缺陷,也带来了基尼系数估计的偏差(尤其是低估),但是,与其他住户调查数据相比,无论是在样本的代表性方面,还是在收入指标的测量上,统计局住户调查都具有明显的优势,因此得到的基尼系数相对更可信。

从基尼系数变化趋势来看,此次统计局公布的数据显示,全国居民收入不平等在2008年之前处于上升的趋势,之后转升为降。如上所述,这一点也是引发质疑之处。对此,我们也是持谨慎态度。当然,2009年以来出现了各种各样的有利于收入差距缩小的因素,也出现了导致收入差距扩大的因素。对这两类因素相互作用的结果有待于进一步的测算和研究。从缩小的因素来说,常规调查中城乡之间收入差距的缩小是重要的一个因素。城乡收入倍数(即城镇人均可支配收入与农村人均可支配收入的比率)从2003年开始出现新一轮上升,直到2009年达到3.33,之后开始缓慢下降,具体数值为2010年的3.232011年的3.13以及2012年的3.10。我国城乡分割以及城乡收入差距是全国居民收入差距的最大组成部分,根据我们测算结果,全国居民收入差距的40%50%是由城乡收入差距带来的,因此城乡差距的缩小是近年来全国居民收入差距缩小的主要推力。城乡收入差距的缩小,意味着农村居民收入增长超过城镇居民。近年来农民收入快速增长的源泉主要有农产品价格上升、政府对农村社会保障投入力度的加大、以及劳动力市场中农民工工资的上升。这些都是有可靠数据支撑的。当然,如果房价上涨,垄断行业收入的过快上升等一系列推动收入差距扩大的因素没有体现在住户调查数据中的话,那么现在估计出来的收入差距的变动趋势就会有偏差。

 

2. 国家统计局的基尼系数与西南财大基尼系数的比较

人们在质疑统计局基尼系数时援引的证据之一是此前西南财大公布的基尼系数。上个月(201212月)西南财大中国家庭金融调查中心根据其住户调查计算并公布中国居民基尼系数,数值为0.61。这一估计值是迄今为止根据住户调查数据得到的中国居民收入基尼系数的最高估计值。这个超高的基尼系数正好迎合了人们对我国收入差距过大,以及腐败现象盛行的不满情绪,因而得到社会各界的普遍关注。

但是,西南财大基尼系数的可信度究竟如何呢?简单地说,这个基尼系数被大大高估了。该基尼系数估计所基于的住户调查,无论在样本抽样上,还是在住户收入的收集上,都存在明显的缺陷。在抽样上,除了样本量过小(全国8000户),抽样误差较大之外,样本抽样过程存在明显的偏重。具体地说,县市样本主要集中在东部,村/居委会样本明显偏重落后地区的村委会和发达地区的居委会,由此严重地忽略了处于中等收入水平的村/居委会样本(落后地区的居委会和发达地区的村样本)。住户样本的选择给予高房价居委会以更大的权重,与此同时低估了农村住户的样本。在收入信息收集上,仔细观察调查问卷显示,该调查仅仅收集了每户受访者及其配偶的收入,而没有收集家庭其他从业人员的收入。不仅如此,在收集计算农业生产经营和非农生产经营收入所需信息上,问卷也存在明显的缺陷。根据问卷收集的相关信息,很难准确地计算农户自产自用农产品收入以及非农经营收入。正是由于样本偏差和收入指标统计上的问题,让该调查对很多家庭给出了不现实的低收入,居民收入差距(0.61的基尼系数)被高估的原因之一也在于此。(关于西南财大基尼系数问题的详细讨论,参见长溪岭,2012;李实,2012;罗楚亮,2012;岳希明,2012[1]

值得提及的是,西南财大0.61的基尼系数并不是由于解决了上述国家统计局高收入样本缺失以及非法收入统计问题之后得到的。西南财大的住户调查并没有解决统计局住户调查中存在的问题。相反,无论在样本抽样上,还是收入指标的取得上,西南财大的住户调查都存在明显的缺陷,因此其基尼系数不足以作为衡量统计局基尼系数偏差的证据。相反,由于统计局农村样本和农户收入统计的相对可信性,统计局住户调查结果倒可以用来衡量西南财大基尼系数是否存在偏差。具体结果是,2010年农村居民收入基尼系数,统计局的估计是0.378,而西南财大的估计是0.60

 

3. 我们的基本结论

统计局此次公布的全国居民收入基尼系数基本是可以接受的,是可信的。当然,这并不是说统计局此次公布的基尼系数是完全准确的。在接受这些估计结果时,我们同时认识到其局限性。首先,统计局的基尼系数没有反映各种各样的非法收入。很显然,不能把非法收入纳入基尼系数估计显然低估了我国居民收入差距。至于能否期待统计局解决非法收入统计问题,是一个见仁见智的问题,对此我们没有抱太大的期待。其次,即使抛开非法收入不谈,基本接受统计局基尼系数并不意味着我国全国基尼系数在2012年一定是统计局公布的0.474。数据收集工作的进一步完善和估计方法的不断改善都有可能使得现在公布的基尼系数出现上下23个百分点(即0.4440.504)的波动。这实属正常,但并不因此改变我们的基本判断。

国家统计局此次公布全国居民收入基尼系数是一次新的尝试,希望以后能变成一种常规工作。但是由于 “历史欠账”太多,在取得绝大多数人认可之前,统计局要做的事情还有很多。最重要的是,应当对此基尼系数的估算过程给出详细的解释,也有必要公开原始调查数据,允许民间研究机构对数据的可靠性进行验证,否则公众的质疑无法消除。从研究过程来看,基尼系数只是一个数,但取得该数背后的过程是极其复杂的,对估计结果加以详细说明是完全必要的。从社会公众的反应来看,基尼系数不仅是一个数,它被倾注了更多理性的,非理性的主观情绪,也有“历史的记忆”。作为理性的研究者来看,这次社会公众对国家统计局公布的基尼系数强烈质疑的现象应该引发我们更多的思考。问题的本质不在于这个数字本身的准确性,而在这个数字之外,因而统计制度的改革是必须的。



[1]长溪岭,2012:《不是基尼系数不能说明中国,而是0.61根本不靠谱》, http://blog.people.com.cn/article/3/1355731168068.html

李实,2012:《为什么基尼系数会高估?》http://www.ciidbnu.org/news/201212/20121227000408706.html

罗楚亮,2012:《对《中国家庭收入不平等报告》的评论》,http://www.ciidbnu.org/news/201212/20121226133704706.html

岳希明,2012:《西南财经大学0.61基尼系数不可信!》,http://www.ciidbnu.org/news/201212/20121228134128706.html

 

本文为原创,如需转载,请说明出处。另本文同时发表于:华尔街日报,地址:我们更应该相信谁的基尼系数?,该版本略有不同。

本次学术讨论的相关文献:

岳希明、李实:我们更应该相信谁的基尼系数?

甘犁:以公开科学的抽样调查揭示真实的中国

岳希明、李实:缺少说服力的回应——对西南财大住户调查项目公布的基尼系数再质疑

甘犁:关于中国家庭金融调查数据的再说明

 

 (作者单位:岳希明,中国人民大学财政金融学院;李实,北京师范大学收入分配研究院)

(责任编辑:詹鹏)

 
分享到: