辅助功能设置

文字大小

色彩设置

单色 柔和色 dark

阅读工具

底部遮盖 标尺

文章

NICAR分享 | 在可视化中,如何处理人口普查数据?

想知道如何为数据可视化处理人口数据?此次NICAR会议上,前USA Today的数据记者(现供职于《华尔街日报》)Paul Overberg就以USA Today Census Tool为例,教给你诀窍。深度网经授权转载镝次元数据传媒实验室(ID: dyclub-org)的分享,还可参考深度君总结的:《新闻数据使用要领清单:避开陷阱,完善处理流程》(戳标题即可进入)哦。


封面

“2043年,美国将成为一个种族多样化的国家。”今年NICAR会议上,来自美国人口普查局的Stephanie Ewert这样说道,她所在部门负责统计移民数据以及移民社会经济情况的调研。

这句话可不是空口无凭。通过USA Today Census Tool,一看便知。

1970年,美国政府展开首次具有现代意义的人口普查后,诸如自杀率、犯罪率、宗教分布、男女比例等也随之出现,并逐渐成为国家发展的重要衡量指标。USA Today的多样性指数则分析了自2000年到2010年美国种族多样性变化,并且对未来四十年的趋势做了预测。

跨越时空的种族多样化差异

USA Today Cesus Tool
比较时间和空间:例如在任意的时间和空间里比较种族多样化差异

USA Today Cesus Tool在1991年首次出现,该工具基于十分简单的理念:两个人在种族方面的差异。这个差异被评级为0-100。
gif2【图1】底部是一个时间滑块

gif3
【图2】鼠标悬停在地图上,可以看到更多的细节信息(这是该作品的主要的交互元素)

无论是那些变化大小,整体情况一览无余。值得注意的是即使是一些地区种族多样性差异不大,比如只有10到17的改变,但是对于当地而言已经是很大的改变了。

指数公式:靠谱吗?

指数是一种汇集各种不同的指标的综合性统计,奇妙之处在于数据的维度层级,你可以通过降低数据维度从而进行大量差异比较。USA Today多元化指数(USA TODAY Diversity Index)也是如此。

它的计算公式如下:

1-((%White^2 +%Black^2 + %Asian^2 + %AmericanIndian +%nativehawaiian) * (%Hispanic^2 + %NonHispanic^2))

(注:white为白人,Black为黑人,Asian为亚裔,AmericanIndian 为印第安人,nativehawaiian 为夏威夷土著, Hispanic为西班牙裔, NonHispanic 为非西班牙裔 )

注意,由于千禧年之前人口普查中勾选“多种族(双亲属于不同种族)”选项的人数太少,所以该选项就没有被考虑列入公式进行加权。不过公式一直都在完善中。

看见未来,如何在其他报道里使用Diversity Index?

还可以怎样运用此指数?如何在其中找到自己的故事?开来用特定数据来定制你的社群和城市报道。

  • 地区与全国平均数据的比较,在相似表现的地区之间进行比较;
  • 学校数据:查询任一学校的种族多样性;
  • 狂飙的种族多样性:北弗吉尼亚沿着高速路通往Washington D.C.的近郊
  • 北弗吉尼亚的学校里,学生们有多么国际化?
  • 在你住的地方,有多少“本地人”?比如,出生地:是在科罗拉多州还是美国西部或者别的地方,甚至是国外?他们有多么“土生土长”;
  • 多样性越大,社群就会越稳定,经济情况也会更好。

如何使用人口普查数据

表格名称:B02001 Race within the census data
下载链接:Censusreporter.org/tables/B02001
表格名称:B3003: Hispanic

第一步:登入census.org-开始输入表格数字(例如B02001)—然后你会得到关于表格的基本信息—你可以输入一个地名,或者你想要知道的东西。

第二步:一旦选中某个地方,你可以看到这个地方的种族组成情况,同时左边的页面上还有其它的选项。接下来你可以下载数据,获得一个带有元数据文件的一个 excel 文件压缩包。

第三步:通过代码识别关键栏。你可以通过打开元数据文件来实现,也可以查阅不同栏的名称,直到你找到想要的东西。

第四步:为了便捷地分析,建议删除边际误差和B02001007表格。

第五步:使用 excel 函数计算人种/民族比例,运用USA Today的方程式。

第六步:做一些取样测试,看看这些模式是否与人口普查机构的统计相似。


镝次元数据传媒实验室(ID: dyclub-org),以武汉大学为研究基地,对接丰富的数据资源和媒体资源,以产学研结合方式,积极参与和推动数据新闻的人才培养、技术创新、行业生长和理论发展。

镝次元作者/田青
编译/蔡家欣,曾明
运营/刘雅露
深度网编辑/周炜乐

您可以根据知识共享协议条款免费转载这篇文章

转载


阅读更多

GIJC 侧记 GIJC23

#GIJC23 侧记:危险者的聚会

“如果把这两千多个人都消灭了,全世界的独裁者应该会睡个好觉。”在 GIJC23 现场,我们一直开这样的“地狱玩笑”,却又如同另类的集体心理诊疗。自由作者邹思聪在这篇侧记中讲述了三位俄罗斯流亡记者的故事——他们虽然再也无法回国,却在异乡坚持报道、建立生活。

GIJC 侧记 GIJC23

#GIJC23 侧记:哪怕空间再小,也不要停止做事

在参会之前,于月想知道这个世界上有没有哪些同行和我们一样处境艰难,又是怎样克服?在听到来自世界各地的同行分享后,她觉得哪怕空间再小,也不要停止做事。

GIJC 侧记 GIJC23 全球深度报道大会

GIJC 侧记:残缺的数据,模糊的面孔,天秤倾斜的判决——从女性杀戮报道说起

如今我们究竟需要怎样的报道?在影响力如此受限的当下,我们究竟如何定义和看待“impact”?在报道杀戮女性的分享中,独立记者易小艾找到了部分答案:有些记录,若没有留下,真的会丢,若还有一些力气,就一起守住每一个留下记录的可能吧。