海量统计数据如何分析辨别?

10/19/2012 9:54:36 AM

两度出任英国首相的本杰明·迪斯雷利有句名言,世界上有3种谎言:谎言、该死的谎言,还有统计数据。事实上,统计数据本身并无罪,可人们往往喜欢滥用统计工具来支撑自己的立场,而不是反映真实情况。

  如今,来自于方方面面的统计数据、调查数据越来越多,并日益影响到普通人的生活和心态。面对海量的数据,该如何分析辨别?记者就有关问题采访了有关专家。

  问题一

  物价涨幅与个人感受不同?

  统计数据常是“一篮子”项目的全国综合水平,往往与个人感受不一致,某些指标或算法都有其特定含义。退休职工田英对CPI非常关心,但她发现,每个月和自己家庭账本“对账”时,账本里的肉价、菜价都翻倍了,可当月CPI还是个位数,这统计局的数据是不是造假了?

  造成这个结果的原因有4点:一是人们常用少数商品价格水平与相关部门统计综合平均水平相比较,而统计局公布的CPI构成分8大类262个基本分类;二是人们喜欢用某一地域的价格水平或服务水平与全省、全国的平均水平相比较;三是人们对某一调查的样本及统计口径不了解。

  问题二

  仅凭平均数可能会被误导?

  平均数不能代表一组数据,更不能反映一组数据间有多大差异,还会受到极端值的巨大影响。

  由于可以简洁地反映样本总体的情况,统计中的“平均数”无处不在。平均数也具有误导性,常会掩盖原始数据的信息。“仅靠平均数不能反映一组数据间有多大差异。平均数通常需要与标准偏差结合起来报告或考察,才能得出相对全面的分布描述。”清华大学新闻与传播学院教授金兼斌说。

  问题三

  哪些调查“百分比”不可信?

  样本容量小、抽样不科学,一些街边问卷与网上调查的结果不可偏听偏信。金兼斌认为,统计数字误导最常见来自抽样问题。抽样调查首先要保证一定的样本容量。另一方面,样本能很好地代表总体,避免调查受到社会倾向的影响。今年8月,中国青年报社会调查中心的一项网络调查显示,83.2%的受访者确认现在社会谣言很多,其中34.4%的人表示“非常多”。实际上,该调查是仅对1714人进行的在线调查。

  问题四

  统计数据为何会打架?

  统计方法不同以及行政干预会导致数据打架,这提示统计制度及其方法改革的必要性。

  2007年4月,北京市国土资源和房屋管理局发布该市一手房的销售均价每平方米环比下降400元,几天后,当地统计部门公布新建商品住房售价环比上涨1.2%。统计数据差距之大的原因主要还是统计方法不同。前者是以3月份备案的住房销售总额和销售面积相除,得出的平均交易价;后者考虑到大城市房屋有高中低档之分,地段差别较大,普通住宅价格相对低但购买者多,豪宅单价高但购买者少,因此对不同房价赋予了不同权重,按加权指数计算。

  除了统计方法,行政干预也是造成数据打架的原因。例如,我国GDP核算采取分级独立核算体制,国家和地方分别核算GDP。为什么近5年每年各地公布的GDP汇总数据,都会高于全国呢?除重复统计等因素外,也不排除某些地方GDP虚报,因此还存在地区GDP核算易受地方干预等弊端。

  为避免数据打架,我国统计制度方法改革势在必行。图文均据人民日报

  新闻链接

  央行调查显示:

  居民对物价满意度下降

  中国人民银行昨日发布的三季度城镇储户问卷调查显示,当前居民消费意愿维持低位,储蓄意愿继续升高。

  调查显示,在当前物价、利率以及收入水平下,82.8%的城镇居民倾向于储蓄,17.2%倾向于“更多消费”。

  针对当前房价水平,调查显示:3/4的居民认为过高,难以接受,此数据较上季提高1.3个百分点,为2009年有调查以来的最高值。

  居民对物价满意度仍不理想,当期物价满意指数为14.8%,比上季下降2个百分点。收入感受方面,居民收入增速趋缓,当期收入感受指数50.3%,较上季回落1.8个百分点。据新华社