所有统计数字里,最不该被怀疑的就是人口普查。
文/巴九灵
千呼万唤之下,原定4月上旬公布的#第七次全国人口普查数据#,终于在前天(5月11日)公布了。
由于推迟了一个月,引来不少坊间猜测:“是不是数据太难看,临时决定修饰一下?”
公报发布后,有人把数字来回算了算,发现“重大漏洞”,于是更加坚信“修饰数据”一说。
等等,不要乱算。
1、常见错误
错误算法一:
已知A:年统计公报显示,中国内地总人口万。
已知B:第七次人口普查公报显示,中国内地总人口万。
计算:-=,说明年中国内地净增人口万。
已知C:历年统计公报显示,年至年,中国内地人口逐年净增万、万、万、万、万。
结论:年居然净增万?太反常了,肯定有假。
错。
错误算法二:
已知A:第七次人口普查公报显示,中国内地0—14岁人口万。
*“七普”以年11月1日为标准时间,所以0—14岁人口对应年11月1日至年10月30日出生人口,近似等于年至年出生人口。
已知B:历年统计公报显示,年至年出生人口共计万(年数据有过修订),年均出生万人。
计算:-=,说明年中国内地出生人口万。
已知C:国家统计局局长宁吉喆在“七普”新闻发布会上表示:年我国出生人口为万。
结论:自相矛盾了,肯定有假。
错。
2、错在哪里
我国的人口调查分为三种:
每年都会进行1‰(约数,实际不到)人口抽样调查,呈现在统计公报上。
每五年会进行一次1%人口抽样调查,有专门的数据公报。
这两种抽样调查,质量一言难尽……因此我们才要每十年进行一次人口普查。所谓普查,就是不再通过抽样估算整体了,每一个人都要尽可能统计上。
“七普”告诉我们,中国内地共有人,有零有整。不仅如此,这里每一个人的性别、年龄、民族、学历、身处几口之家、人在哪里、户口在哪里,都有统计。其余就业、婚姻、生育等数据不是普查,但也抽查了超过一亿人。
所以,普查数据是用来修订公报数据的,公报数据是不能用来证伪普查数据的。
我们来看一个过往案例:
年统计公报显示,当年出生人口万。
年第五次人口普查数据显示,1岁人口万。
*“五普”以年11月1日为标准时间,所以1岁人口对应的是年11月1日至年10月30日出生的人口,姑且以此对比公报数据。
两相比较,相差超过60%。
不仅是年,整个年代,一共差出万出生人口。
人口普查漏掉了这么多人?还是瞒报了这么多人?
不,是此前的统计公报高估了。不难看出,越是靠近年(第四次人口普查),两组数据越是接近。
因为在年—年,中国出现了一波婴儿潮,年均出生人口高达万。年“四普”发现,下半年至上半年,新生儿万(真实数字更高)。
以此作为参考值,加上1‰的抽查,就估算出了年的人口数据;以年作为参考值,加上1‰的抽查,就估算出了年的人口数据;依此类推。
直到年“五普”才发现,错大发了。
抽样调查预见到了出生人口下滑,但没想到滑这么快。
变化越剧烈,抽样越容易失真。累积十年,就会有巨大的偏差。这时候把公报数据和普查数据直接相加减,容易得出很荒谬的结论。
只有《中国年人口普查资料》(完整数据,不是刚发布的公报)能告诉我们,过往十年的出生人口究竟如何。在它出版之前,对于刚过去的十年,我们其实并没有可靠的人口资料。
如果你看到一篇文章,质疑“七普”数据,而质疑的算法是掏出近十年的人口数据(无论来自统计局还是公安部)加来减去,不用怀疑,他这是以“邪”压正。
*昨晚(5月12日),国家统计局