实用贴|数据图析二胎:案例工具推荐

Print More

自从十八届五中全会公报允许普遍二孩政策以来,各界舆论纷纷,而计划生育和二胎政策的影响分别是什么?放眼世界,中国的生育率水平几何?深度君精选全球生育率及其影响的数据图和可视化案例,推荐可视化简易做法、工具、代码,看看介绍动手学起来吧。


1. 普利策中心:全球生育地图

放眼世界,中国生育率水平几何?普利策危机报道中心Pulitzer Center on Crisis Reporting)采用联合国、世界银行和权威期刊PLOS Medicine的数据绘制了一张全球各国生育数据可视化图表,告诉你答案。

全球生育率图-普利策

普利策中心:全球生育率地图

普利策-图2

普利策中心:全球不育率地图

调查发现,全球总体的生育率在稳步下降,但是撒哈拉沙漠以南的非洲却居高不下。在该地区人口最多的国家尼日利亚,平均每位妇女在一生中生育六个孩子。他们也整合了不孕不育的数据,发现全球一百多万异性恋夫妇会不育。不育的男女双方都有可能遭受遗传病、传染和非传染疾病的侵袭,而且服用某些治疗药物还会增加患病风险。中美洲地区甚至出现了“不育带”,性传播疾病和不安全流产导致的传染等问题频出。

作品以地图形式呈现数据。鼠标移到哪个国家,就会显示该国的总体生育率、原发不孕和继发不孕的比率,以及避孕工具使用的比例、每千名儿童的死亡率和人均GDP数据,可以一窥当地生活水平、避孕情况和生育率之间的关系。作品根据生育率或不育率的高低来标注国家地区的颜色深浅:撒哈拉以南的非洲几国(尼日尔、乍得、尼日利亚、马里等)以及中东的阿富汗是生育率最高的地区,而位于位于东欧的乌克兰、白俄罗斯、拉脱维亚,中东的也门和非洲的摩洛哥、喀麦隆和中非共和国则是不育率较高的国家。中国平均每个家庭有1.63个孩子,和经济水平较高的欧洲各国、以及加拿大、澳大利亚和巴西等地区位于同一水平。原发不孕率低于俄罗斯、美国、加拿大和印度等国,处于世界较低水平。(未获取继发不孕率数据)

如果想了解:非洲为何在生育率很高的同时,不孕情况也很普遍?非洲政府、慈善团体和医疗卫生工作者如何帮助夫妇控制生育呢?可以参考PRI(国际公共广播)的专题报道“家庭的选择”


2. 《卫报》:计划生育影响几何?

计划生育35年来对中国产生了什么影响?《卫报》制作了四张图来看人口增长、工作适龄人口、老龄人口抚养比和性别比例受到的影响。

1) 人口增长放缓
联合国数据显示,中国人口增长(粗生育率减粗死亡率)已经从1980年的每千人新增15人降为每千人新增5.5人。卫报-图1

2) 工作适龄人口缩减
近年来,15到64岁的工作适龄人口持续缩减。根据中国政府的统计,15岁到59岁之间的人口减少尤其明显。从2013年到2014年,该数字缩水370万,总数为9.158亿,此趋势预计还会持续。卫报-图2

3)老龄人口抚养比上升
伴随着适龄工作人口的缩减和老龄人口的增长,受供养人口的比例不断下降,老龄人口的抚养比则逐年上升。
卫报-图3

卫报-图32

4) 性别比例更为失衡
联合国的数据表明,目前中国的性别比为106名男性比100名女性,高于世界平均水平,也几乎高于其他单个国家。卫报-图4

而新生儿的性别比例更为不平衡:男比女为120比100,已成为世界最高值。根据野村全球经济的分析:如果该趋势持续,未来中国1/5的适婚男青年将无法迎娶本国新娘。


3. 《华盛顿邮报》:为何要放开二胎?

中国为啥需要全面放开二胎?《华盛顿邮报》用一张图形象地解析了原因。根据Max Roser在Our World in Data上的统计,中国总人口从建国后到2010年期间不断上涨。20世纪50年代,中国的生育率一直走高。在三年自然灾害出现短暂下降后,在60年代到70年代每千人的生育率远超死亡率。

一图生育率-WP

中国早在60年代初期就提倡晚婚,政府在1971年开始倡导计划生育,于1982年将计划生育定为基本国策,此后中国的生育率明显降低。目前,生育率和死亡率之间的差距缩小,上世纪生育高峰出生的人口逐渐成为老龄人群,而能够供养他们的年轻工作人口越来越少,可见放开二胎的紧迫性。


4. 美国人口咨询局:二胎政策之后有啥变化?

对于二胎政策的影响,美国人口咨询局(Population Reference Bureau)就做了大胆的预测

1) 中国总人口的变化

他们分别绘制出了计划生育政策继续实施、2016年女性均生育二胎、2050年女性基本上能生育二胎三种情况下总人口的预计变化趋势。第一种情况中,中国总人口会在2030年达到14.2亿的高峰,随即下降。第二种情况,人口高峰会延迟五年,大概为14.6亿。2050年接近二胎的预期则较为现实,在此情况下,中国2030年会出现14.3亿的人口高峰。第三种预期和目前计划生育政策的预期之间相差2300万的人口,仅比目前水平高了两个百分点。

PRI-1

2) 年龄段人口比例

第二张图展示的是2015年和2050年普遍生育二胎后年龄段人口数的对比。即使新生人口会增长,但是未来35年间,中国人口的年龄结构将发生巨大的变化:65岁及其以上的退休人口将会翻倍,15岁以下的儿童人口则会下降。在2050年,适龄工作人口将少于非适龄工作人口。PRB-2


5. 实用入门:如何制作生育主题的可视化作品?

如何制作一款效果多样又清晰明了的可视化数据图呢?德克萨斯基督教大学的助理教授Kyle Walker分享了自己制作欧洲生育率可视化作品的技巧、资源和代码,步骤清晰且即拿即用:

Walker首先推荐的就是世界银行的公开数据目录,为数据新闻人提供海量可读的数据、图表和API,可以通过Python,R,Ruby和Stata的数据语言读取。文章推荐了WDI扩展包——可方便用户用R语言快速读取世界银行数据组,和rCharts扩展包——可用于制作动态十足的D3可视化效果。

他的目标是做成一个以交互式探索不同地区生育率如何以不同方式逐年下降的作品,和学生们讨论观察生育率逐年变化的必要性。一开始,他以R语言和WDI扩展包调用了世界银行的API,获取了1960年以来欧洲国家完整的逐年生育率数据。他所使用的代码如下:

数据图-代码一

同时,为了将数据可视化,他选择了NVD3数据库——一个D3制图数据库,适合R语言用户用rCharts读取。以下则是清理数据、同时用rCharts制作交互式图表的代码:数据图-代码二

生育率图1

呈现全部国家数据的效果

之后他在控制台键入tfrPLot,一张基本的国家生育率图就显露眼前:

这张图大致能体现数据,但是信息杂乱,可读性不强。此时NVD3和rCharts就成了数据图可视化的关键:你可以点击图例圆点来显示或隐蔽数据线。如果你双击国家名称,图表将只显示该国家的数据线。也就是说这张图就像一个互动式应用一样,用户可以随心所欲地控制它的呈现方式。

点选几个国家的效果

点选几个国家的效果

而且,rCharts还能包含好几种选择,指定你想呈现的图表类型。具体做法,请参考:Visualizing fertility trends in Europe,看看作者是怎么做的吧。

简而言之,为了制作生育率的图表,请参考以下步骤:

1.先安装R语言扩展包: WDI, plyr, and rCharts. CRAN还未包含rCharts,所以你需要从GitHub上下载devtools包来安装rCharts。你也可以直接输入命令:devtools::install_github(‘rCharts’, ‘ramnathv’, ref=’dev’).
2.运行以下命令:
source(“https://raw.github.com/walkerke/teaching-with-datavis/master/tfr-in-europe.R”)
3.在R的控制台键入tfrPlot制作图表即可。小提示:在RStudio的阅览窗口不太容易显示NVD3的图表,所以最好另外打开浏览器查看。

深度君还推荐一种显示世界各个国家和地区生育率逐年变化的动态图,也是参考世界银行数据制成,图表和做法详情请参考:World Bank data visualization: lower fertility, longer lives还可以点击Google Public Data Explorer获取数据哦。

生育图的案例和做法到手了,不妨试试自己上手制作、创新可视化效果吧。

Leave a Reply

Your email address will not be published. Required fields are marked *