人口之惑(2021.05)

第一章人口之惑

注意本文既然命名为人口之惑那就意味着整体数据中存在逻辑上无法自洽之处为了彻底说明问题我必须从最基础的部分开始讲起国家统计局官网今天发布了2020年第七次人口普查的1-8号公报数据它们在官网的截图长成下面这样
20230118001

官网地址为http://www.stats.gov.cn/tjsj/

根据这次的普查公报我们得到了一些关键数据2020年全国人口总量为141178万人不含港澳台较2019年的140005万人大幅增加1173万注意2019年的数据为人口抽样调查的结果除了10年一次的人口普查之外这种人口抽样调查每年都会进行逢5的年份为1%抽样其它年份为1‰抽样由于近年来我国全面实现了个人信息的电子化除了极个别的情况公安部门打开电脑可以查阅全国每个人的详细户籍登记信息手机信息及社保信息等这套个人电子信息系统有效协助了人口抽样调查的开展相关调查可以将有限的精力集中在出生人口死亡人口以及搬迁人口这种变数上因此每年的数据可信度都很高就今时今日来说出生之后完全不办户籍登记的情况几乎已经不存在了即便是超生人口也可以先办一个出生证罚款可以以后再说隐瞒人口的意义不大理解了这样的背景我们再来将本次人口普查数据中的总人口15-64岁人口65岁以上人口数据摘录出来并入1990年至今的大表内到这里不和谐之处就体现出来了

20230118002

我国历年的新增人口1990年为1629万此后逐年下降从2000年开始新增人口下降到了1000万以下为957万2010年的新增人口继续下降到641万注意这些年份都有人口普查新增人口数的下降趋势是非常明显的2010年后我国分步放开了二胎所以新增人口数量有所反复2016年达到了阶段性峰值809万但是此后又开始迅速萎缩2019年的人口增量只剩下467万考虑到2016年后我国全面实现了户籍信息的电子化这意味着2016年之后的抽样人口数据已经非常可信了放开二胎之后的人口再次进入萎缩趋势也是非常明显的

然而2020年的普查数据横空出世当年度全国新增人口1173万这真是石破天惊让人目瞪口呆1173万较2019年的新增人口467万足足增加了151.2%就这种增幅实在是犀利到令人不知道应该怎么评价了

对于这种突如其来的人口增量我们当然有必要挖一挖根由有意思的是15-64周岁的适龄劳动人口并没有增长而是出现了下降从2019年的98910万下降到了2020年的96776万年度降幅2.16%这导致2020年扣除在校学生之后的适龄劳动力占比下降到了63.1%倒退到了上世纪80年代的水平这种降幅是符合我们的一贯理解的毕竟每一年的新增人口都在下降人口老龄化一定会导致劳动力的总量下降所以扣除在校学生的适龄劳动人口在2014年达到峰值的93566万之后就一路下降2020年持续下降到89019万相当于2007年的劳动力水平这是非常正常的数据

然而恶搞之处在于65岁以上老年人口的数据突然出现了暴增2020年的数据为19064万较2019年的17603万增加了1461万而此前老年人口的年度增幅也就是900万这个区间2020年即便是多一点1000万出头也就是了达到1461万这个数量级让我实在是无法理解2020年新增的年满65周岁的老人也就是1955年出生的老人1955年我国的人口出生率突然暴涨了一轮吗当年度较1954年多出生了几百万人口基于这个疑问我查阅了一下国家统计局官网数据库里的1950年代的人口出生率顺手截了个图见下图结论非常清晰1955年的人口出生率32.60‰远低于1954年的37.97‰人口自然增长率20.32‰也远低于1954年的24.79‰1955年的出生率和人口自然增长率都较1954年有了大幅下降所以2020年突然增加的1641万65岁以上老年人口我个人真不知道是怎么来的

20230118003

这里必须说一下1955年我国总人口61465万当年度出生人口2004万我把这个数据加粗放大希望大家记住这个数据我们待会儿还会用到接下来我们继续深入分析人口增量的由来毫无疑问人口增量=当年度新出生人口-死亡人口2020年的人口出生率和死亡率在目前的普查公报里没有发布或许未来会在普查详细数据库里发布总之现在还看不到不过没关系我们精通数学并且有此前历年的数据我们可以自己算出来

本次普查公报发布了2020年的人口年龄构成表见下图

20230118004

关键数据在于0-14岁的总人口数25338万恰好我搜集了此前每一年的人口出生数从2006-2019年的出生人口合计为22736万我们假设其中任何一个儿童都不会夭折全都是健康宝宝天使宝宝扣减一下我们就得出了2020年的出生人口为25338万-22736万=2600万一个非常吉利的数据

好吧现在2020年的年度新增人口有了1173万出生数据也有了2600万那么2020年的死亡人口数据也可以反算出来了2600-1173=1427万

接下来我们把这组数据同样放进1990年至今的人口出生率和死亡率数据表供各位感受一下

20230118005

2020年的人口出生率突然就达到了18.41‰恢复到了1990年代早期的水平这个数据我就不多解释了总之就是非常厉害关键是死亡数据2020年死亡了1427万人远远超出此前接近1千万的水平死亡率8.30‰也是远远超出近十年千分之五以下的平均水平这是怎么回事

更关键的问题还在于这个死亡数据与老年人口数据之间出现了非常严重的逻辑上的不自洽2020年65岁以上老年人口新增了1641万当年度我国死亡人口1427万今时今日我国死亡人口基本上都是老年人年轻人的死亡率还是非常低的这一点我们还是要相信毕竟这是常识所以这意味着2020年一定要有超过3千万的老年人口补充进入65岁以上老年人口这个群体才能实现老龄人口的数据增长才能实现数据逻辑的自洽

然而最令人无法理解的事情发生了1955年我国出生人口为2004万即便这些人在随后的穷折腾里平安喜乐的活了下来一个都没有中途夭折然后改革开放之后他们也完完整整的熬过了90年代初期的通胀潮90年代后期的下岗潮然后一个不剩的干到了退休并活到了现在也远远凑不够3千万的数

所以就2020年的人口数据而言我实在不知道应该怎么分析数据与数据之间是存在逻辑上的强关联的尝试对任何一个数据进行优化都会对整个数据逻辑链条带来巨大冲击就2020年的人口普查数据而言我个人缺乏平复这种冲击的能力希望我大中国能除了我之外还能再诞生一位数据大咖可以分析整个人口数据链条将我上面的这些疑惑之处全都完美的解决如果有的话希望各位能在本公号后台给我留言让我看到谢谢

第二章人口数据再剖析

昨天我讲了一下国家统计局新鲜发布的人口普查数据之中存在的逻辑冲突希望能有人为我解惑但是很可惜至今为止没有看到合理的解释这篇文章大家现在也看不到了这是意料之中的事今天我们继续来分析一下没看过昨天的文章也没关系今天这是全新的一章

首先我们必须对现在的人口普查技术有清晰的认识这次人口普查事实上就是在公安部门的电子户籍信息的基础之上进行的普查也就是我们号称的电子普查截个相关新闻的图给大家看看

20230118006

事实上我大中国的户籍信息电子化已经实现超过6年了近年来相关相关信息系统不断的完善身份证重号的现象也都逐步予以了解决可以说现在不在户籍信息系统里的人已经非常罕见了误差率不会超过千分之一即便在偏远山区的小村落伴随着我国基层党组织工作的强化以及扶贫工作的全面开展入户也成为了最基本的要求生了娃不落户的现象已经几乎不存在了这么说吧今时今日除非你自己一家人呆在深山老林里做野人不属于任何社会组织也不跟外界发生任何商品交易不然但凡你生了娃敢不去落户口村支书会让你精准的认识到马王爷为啥生了三只眼所以第七次人口普查的技术难度其实是很低的在很多地区都是通过短信等电子方式完成的普查其实只是对户籍电子信息进行了一次再确认而已

理解了这一点我们才能更加深刻的理解事实上 现在人口普查工作的意义已经不大了现在不比十年前二十年前了现在每个人的信息都在系统里了如果国家统计局出来放话说现在还有数以千万计的人口不在系统内要靠统计调查队的人挨家挨户钻山沟走树林把这些人找出来公安部门能跳起脚来骂人实在需要进行入户调查的主要也就是搬迁人口比如老蛮我这种前年在深圳工作去年调广州今年又调广西说不定明年又调去哪里了这种情况需要两地统计部门予以协调不要搞出重复统计但是遗漏的可能性是不存在的如此而已

在昨天的新闻发布会上国家统计局给出了几个很有趣的数据从2018年以来人口出生数持续走低2020年出生人口的大数是1200万相关新闻的附图如下

20230118007

我这里先说明一下2020年的出生数据只在新闻发布会上提了一嘴在人口普查公报里并没有发布我们在这里就相信这个口头数据好了现在我们可以开始做计算题2020年普查结果总人口规模为141178万扣减2019年的总人口140005万增量为1173万

各位你们必须清晰的认识到人口增量不是凭空而来的它是当年度的出生人口-死亡人口而来的2020年我国出生人口的大数是1200万人口增量1173万所以2020年我国的死亡人口数=1200-1173=27万这是什么意思

为了进一步说明这个问题我把1990年至今的人口出生和死亡数都放出来并把2020年的数据放进去形成了下表的数据

20230118008

对于2020年只死亡了27万人的事情我实在不知道应该怎么分析这大概是由于去年的新冠期间大家特别注意养生吧呵呵

此外国家统计局在昨天下午对于数据上的逻辑不自洽给出了一些解释比如此前年份的数据是抽样调查数据有些人口遗漏的情况事实上户籍信息电子化之后抽样调查已经足够精准了不过这个事我们就不多纠结了那么到底是哪些年的数据失真呢

人口增量从来都不是凭空而来的它一定是出生人口-死亡人口而来的一个非常重要的信息是国家统计局在新闻发布会明确说明了2016-2020年的人口出生数也就是说国家统计局并不会再上修这些年的出生数据那么如果少算了此前年份的人口增量的话唯一的可能性就是多计了近年来的死亡人口

真是天可怜见我国的人口死亡数据那是真没有多计的可能性这个数据是卫生部门和公安部门的汇总数据是以死亡证明为基础的它有可能会漏计部分偏远地区的死亡但是绝不会多计更不可能出现千万计的多计你说卫生部门没事多开上千万张死亡证明是图什么啊存在这种可能性吗

所以我个人实在是不能理解这凭空冒出来的千万级的人口增量到底是哪里来的它总归一定是人口出生数-死亡数的结果人口出生数不会再上修了死亡数里存在泡沫的可能性更是微乎其微那这到底是怎么回事呢我特别希望我大中国除了我之外还能有另外的数据大咖把这个数据逻辑解释清楚解决我这个微不足道的小疑惑谢谢了

第三章三论人口之惑

关于人口普查数据问题这是我的第三篇文章了也是最后一篇本篇之后这个事我就搁下了接下来我将会继续关注如火如荼的通胀潮这么说吧通胀潮可比人口数据吓人多了

就在昨天晚上国家统计局对我的连续两篇文章做出了隔空回应并发在了官网上地址是http://www.stats.gov.cn/tjsj/zxfb/202105/t20210512_1817360.html 我截了个回应标题放在下面有兴趣的朋友可以去看看话说你国家统计局既然都正式回应了那么我第一篇被夹掉了的文章能不能也顺便给我恢复了呢大家都是研究探讨嘛道理越辩越明嘛你把我嘴巴堵上了再作出跟我探讨的姿态这个姿态也不是很大方嘛对不对

20230118009

接下来我们进入正式讨论环节国家统计局这个回应的意思我总结一下是这样的除了十年一次的大普查之外其它年份的抽样调查都是不准确的会遗漏人口累计下来遗漏了整整一千万的人口幸亏这次普查使用了电子信息技术也就是与户籍信息系统联了个网不再纯粹使用手写版这种低级手段所以国家统计局把隐藏在深山老林里的黑户都挖了出来

对这个回应我的第一反应是真厉害给国家统计局点赞本次人口普查的一个核心技术要点是什么呢是每个人都要统计身份证号由此与户籍信息系统实现了相互关联对这一点国家统计局在事前事后都反复予以了强调官网地址http://www.stats.gov.cn/tjsj/sjjd/202105/t20210512_1817336.html这里也给一个截图注意我用红色框标起来的部分

20230118010

在这里我的第一个问题是那些被隐藏起来了的千万人口他们到底有没有身份证号如果这上千万的人口居然长期没有身份证号那么他们这么多年来是怎么生活的他们是怎么处理社保医疗银行和交通出行问题的他们到底生活在哪里公安部门和民政部门这么多年都在干什么为什么有上千万的黑户这两个部门居然始终不闻不问

由于存在这些根本无法解答的疑问所以我又干了一件很有趣的事找出这些隐藏起来的千万人口到底分布在哪里虽然国家统计局非常严肃的要求不能拿2020年的普查数据与2019年的抽样调查数据做对比不过为了找出那隐藏起来的一千万人口到底在哪里我依然进行了一番了对比我将本次人口普查公报上的分省数据与2019年各省发布的人口数据进行了对比毫无疑问年度增量最大的省份就是在历年的抽样调查中隐藏了人口的省份数据表在下面请各位在阅读下表的时候先猜一下这上千万黑户是不是隐藏在了中西部的深山老林里

20230118011

解释一下2020年的分省人口之和140978万较第七次人口普查结果141178万少了两百万人这两百万是军人不纳入分省人口统计2019年分省人口之和140385万较当年度国家统计局发布的140005万又多了380万考虑到分省数据未计入军人的问题其实是多了500多万所以2019年国家统计局事实上基于重复计算的问题下调了各省的汇总数据在人口问题上重复计算才是最令人头疼的事隐瞒人口不存在的

呵呵各位被上表吓了一跳吧数据比较的结果令人难以置信按照2020年第七次人口普查的结果来看广东隐藏了1080万人口浙江隐藏了607万人口江苏隐藏了405万人口合计超过两千万而中西部地区的人口增长量并不大乃至还有15个省份是负增长正负相抵之后还隐藏了足足一千万人口我十分好奇的是粤浙苏三省到底能够怎么隐藏这两千万人口这三个富裕省份那真是走出家门就必须要用身份证没有身份证寸步难行这两千万人是怎么做到没有身份证长期生存的凭什么啊有没有这么强的生存能力啊

接下来我们再来看一下这隐藏起来的千万级的人口是哪个年龄段的人口为了更清晰的说明问题我将1990年至今的所有人口分年龄数据都放了出来我再强调一次虽然国家统计局反复说普查数据不能与其它年份进行同比比较不过没关系嘛我们通过这个比较可以挖掘出到底哪个年龄段的人口里面有那上千万的隐藏起来的黑户嘛呵呵呵

20230118012

好吧结论依然很清晰2020年儿童增加了1846万老人增加了1461万劳动力减少了2134万此消彼长的结果总人口增加1173万所以说隐藏起来的人口主要是儿童和老人

综合两张表的数据来看所以国家统计局的意思就是粤浙苏三省隐藏了数以千万计的老人和儿童通过第七次人口普查 这些隐藏人口终于被挖了出来对这个结论你信不信

儿童我也就不多说了这三省居然还有上千万儿童出生之后不办出生证的也是出乎我的意料关键在于这三省的老人是怎么隐藏下来的他们这一辈子的黑户是怎么生存的要知道这是广东浙江和江苏啊商品经济高度发达社保基本上实现了全覆盖基层农村政治组织也极其完善在这三个省混成了老年黑户这到底是怎么操作的啊这明显操作不能啊如果非黑户就只会重复统计不会遗漏

不好意思我个人实在是缺乏足够的想象力不能理解这个问题我现在越来越迫切的希望我大中国除了我之外居然真的还能冒出来一位新的数据大咖他精研数据逻辑清晰能够修整出一份挑不出逻辑缺陷的人口数据让我一看之下就大为叹服并竖起大拇指给这整份数据表点赞

毕竟数据与数据之间永远都是存在强逻辑关联的逻辑还是逻辑最重要的永远都是逻辑谢谢各位关于人口问题我的论述就到这里我们下一篇文章还是重新聚焦通胀问题吧