疫情之下,数据的 100 种表达

Print More

注:本文原发自澎湃新闻·湃客频道,全球深度报道网经湃客唯一官方公众号“湃客工坊”(ID:thesparker)授权转载

2020年,一场新冠肺炎的暴发抢过了庚子春节的主调,身处其中,我们亲自为这场抗疫写下注脚。疫情实时地图、扩散路径还原、感染人数建模、问卷信息收集……有数编辑部整理了一批优质数据项目,来看数据的100种表达方式,重温数据创作者们在这次疫情中贡献的力量。

本文分两大部分,一是从病例数据、人口流动、知识科普、应对措施、疫情影响五大角度出发的作品汇总,二是观察了上百个疫情数据作品后我们的一些思考。

有关病例数据的一切

实时地图

澎湃新闻·美数课:新型冠状病毒肺炎病例实时更新地图

丁香园:新冠病毒最新实时疫情地图

北京大学可视化与可视分析实验室:疫情晴雨表等系列交互地图

眼看着疫情从最初的一张静态长图到各家媒体标配的动态地图,并随疫情发展不断完善。如丁香园除地图外,后期还开辟了辟谣与防护、疾病知识、最新信息实时播报栏口,便于读者一站式查询,澎湃新闻·美数课则在国内确诊数据放缓时及时上线「治愈地图」,国外疫情加重时,呈现细分的国际疫情数据。地图成为人们了解疫情动态的第一窗口。

但保证地图数据真实、准确、及时,并非易事。各家实时地图也会出现数据不一致的情况,同样来自官方数据,为何差异巨大?镝数团队对此做了分析。镝数:新冠肺炎病毒肆虐,疫情数据如何辨真伪?

时空追踪

一个贯穿整个疫情期间的数据操作。从最初几百例到7万多例,从国内到国外,从群像到细分的死亡病例、无症状感染人群、确诊儿童,从输入性到家庭聚集性病例……观察每一个或大或小的切口,都让我们对病毒的了解增加一分。

照路明:新型冠状病毒肺炎病例群像:何时发病,多大年龄,在哪分布?

上观数据:新型冠状病毒肺炎值得注意的细节:我们整理了277个病例和41个死亡案例

澎湃新闻·美数课:763例确诊患者的故事,还原新冠病毒向全国扩散的路径

DT财经:7.2万条病例数据首次披露,疫情如何发展到了今天

财新·数字说:新冠逝者:数字后不可遗忘的人

对上述内容分析的详尽程度,取决于政府信息公开程度。对此,一些机构做了有趣的记录:

南都大数据研究院:30省份170份疫情通报谁最高冷?这些地方病例越多信息量越粗、新冠肺炎疫情信息公开60天全记录

帝都绘:疫情爆发后的一个月里,你的城市做了什么?

后期备受关注的国外疫情:

21数据新闻实验室:下船!31天3711人感染新冠肺炎542例 一图复盘“钻石公主号”非常之旅

上观数据:确诊病例超过2000!为何海外疫情的爆发点是韩国,而不是日本与新加坡

澎湃新闻·美数课:2个月,13753例,新冠肺炎如何蔓延全球?

数据冰山:美国疫情分析:检测数据背后的政治“学问”

严肃的人口学八卦:意大利的病死率为什么这么高——来自人口学视角的分析

数字背后,是一个个鲜活的生命。他们的每一次发声,都值得被记录。比如,他们曾经在社交媒体上发出的「求助」。RUC新闻坊:1183位求助者的数据画像:不是弱者,而是你我

疫情预测

病毒什么时候爆发,最终会感染多少人,疫情拐点何时来临,我们什么时候能摘口罩。一切或好或坏的预测,乃至决策,都建立在病例数据的基础上。如前DHS生物监管总监接受大数据文摘采访时所言:疫情中数据的作用无法忽视,但也不能盲信模型。

集智俱乐部:防控力度多大才能遏制疫情发展?网络动力学推演给你答案

chenqin:2月3日全国确诊新型肺炎20438例,死亡425例,目前防治情况如何?

大数据文摘:疫情中数据的作用无法忽视,但也不能盲信模型 | 专访前DHS生物监管总监

过程中,我们经历了由于统计口径更改带来的数据大幅变化。2月13日,湖北新增14840例新冠肺炎确诊病例,随后,接连两天下降,2月15日早上,这个数字又降到了2420。DT财经:湖北数据大幅波动意味着什么?

人口流动数据哪里找

离开武汉的人去哪了?

23日,武汉宣布封城。26日,武汉市长周先旺表示,「目前有500多万人离开武汉,还有900万人留在城里」。有多少人离开武汉?我在的城市安全吗?是春节时人们最关心的话题。毕竟,碰上九省通衢的武汉和春节这个特殊节点,没有谁能置身其外。

来自地理角度的分析:

地球知识局:我们研究了一下如何避开武汉,几乎不可能

基于百度慧眼的人口迁徙数据分析:

新一线城市研究所:这13天,离开武汉的人都去了哪里?

DT财经:离开武汉的那500万人到底去了哪里?

大连民族大学许小可团队:学术视角告诉你:500万武汉人是“逃离”还是“正常离开”

关注武汉之外

人口迁徙导致了病毒向全国扩散的必然性,但当武汉成为全部焦点时,「灯下黑」的问题在前期被忽视了。

社会网络与数据挖掘:当目光聚焦武汉时,湖北其他城市也在“求助”

数据冰山:东莞商丘周口,戴口罩要加油

知链数据:城际迁徙数据告诉你,哪些“地市”需要重点关注?

上观数据:为什么温州会成为湖北外,新冠肺炎确症病例数最多的城市

国际人口流动

时间来到3月,中国大部分地区新增确诊开始收窄,疫情得到控制。此时国外疫情日趋严重,外防输入成为二次防控的重中之重。了解国际间人口流动情况,航班数据是可供参考的指标。

南都大数据研究院:88例境外输入病例中,来自伊朗、意大利占比超85%

航旅圈:大数据丨境外疫情主要从哪些城市飞入国内

Alfred数据室:各城市一日内入境究竟有多少人?

复学复工

一延再延的假期过后,生活总要继续,复学复工迫在眉睫。面对依然严峻的疫情,大城市做好应对了吗?返程复工进度如何?百度慧眼迁徙地图数据再次派上用场。机场、高铁站、普铁站、汽车站等交通枢纽人流量、迁入迁出人口指数、城市内部出行强度是常见的数据指标。

城市数据团:你的城市复工了吗?

新一线城市研究所:复盘节后返城数据,你的城市属于“严控型”吗?

严肃的人口学八卦:全国返城复工进度如何?

新一线城市研究所:你还在居家办公吗?这些城市三成上班族已经回到了公司 | 城市生活复原追踪

作业帮APP一周下载量突破46万次,钉钉收获超82万条1星差评,喧嚣舆情背后,学生、老师、家长们的真实看法是什么?在线教育果真逆势翻盘了?

澎湃新闻·美数课:数说|“停课不停学”,目前大规模线上教学反响如何?

财新·数字说:数字说|“停课不停学”带火各路在线教育 哪些App受关注?

知识科普,最好的时代

传染病

新冠肺炎和 SARS 到底是什么关系?哪类口罩防护最有效?相比其它传染病,新冠肺炎的严重性如何?历史上人类和传染病经历了怎样的纠缠史……突然间,科普遇上了它最好的时代。

回形针PaperClip:关于新冠肺炎的一切

严肃的人口学八卦:为什么新冠肺炎武汉病死率高于全国?

澎湃新闻·美数课:图释两千年传染病史:若瘟疫无法被根除,该如何与之相处?

搜狐四象工作室《病菌与人类》专题则以图绘形式做了系列科普,包括免疫系统如何工作、冠状病毒的分类、传染病潜伏期等等。

野生动物

如今我们经历的一切,都要从一只蝙蝠说起?未来,我们又该如何与野生动物相处。

谷雨数据:瘟疫曾多次放过人类,人类能否放过野生动物?

搜狐四象工作室:753种动物谁最“毒”?附“病毒王”分布图

山水自然保护中心:野生动物非法贸易为何如此乱象百出?

药物治疗

截至2月7日所有的临床试验,已有50项与新冠肺炎有关的临床试验已登记在案,其中既有洛匹那韦/利托那韦(克力芝)等西药,也有双黄连口服液,还包括太极拳。至于新冠肺炎为何迟迟没有特效药,需知新药研发本就有一套复杂的流程,遑论面对的是新型病毒。

上观数据:50项与新冠肺炎有关的临床试验登记在案,里边会有“特效药”吗?

DT财经:成功率仅0.02%,新冠治疗药物距离上市还有多远?

澎湃新闻·美数课:涨知识|新冠疫苗开始临床试验,为何我们至少还要等待一年?

疫情当前,如何应对?

关键节点

事后回顾关键性事件的时间节点,总能发现一些端倪。而与人们情绪密切相关的微博热搜,也部分见证了疫情发展的高低起伏。

第一财经周刊:特别报道——假如武汉的警铃有机会被拉响,可以是哪天?

大数据文摘:两个月热搜分析:疫情之下,哪些时、地、人、物处在风口浪尖

救助力量

澎湃新闻·美数课:盘点|各地驰援湖北的52支医疗队被派到了哪些医院?

DT财经:3万医护逆行背后,是谁在前方驰援湖北?

复数实验室:数读武汉医护感染 | 我们该如何更好地保护白衣天使?

毕导:科学家光写论文不抗疫情?我帮大家解读一下68篇新冠病毒论文

抗疫现场

澎湃新闻·美数课:如何运作一座容纳1461张病床的方舱医院?

镝次元:350多场新闻发布会带你微观防疫过程

RUC新闻坊:那些被吐槽的国家,为抗疫“默默”做了哪些努力?|视野

疫情之下,什么改变了?

对普通人

身处暴风眼的湖北人民,封城对他们来说意味着什么;远离风暴中心,被困在家的你我如何度过这段特殊时期;生活又发生了哪些突如其来的变化。

DT财经:外卖数据下的武汉:普通人的“封城”十日生活

回形针PaperClip:为什么你还买不到口罩

照路明:被新冠肺炎困在家中的中国人,这几天都在干什么?

大数据文摘:疫情期间全民上网图鉴:封城后,武汉内外的人们在线上做什么?

时代数据:多国限制入境,数十万中国留学生学途难归

照路明:后疫情时代:我们如何被新冠肺炎改变了生活?

从没哪个时刻如当下,接收铺天盖地的信息,有真知,就有谣言。

复数实验室:看了946条辟谣信息,我们提炼出一些信息辨别方法

航旅圈:数据 | 韩国人都飞去哪里了,韩国飞中国的都是什么人

Ele实验室:计算机仿真程序告诉你为什么现在还没到出门的时候

对行业/经济/社会

2003年的非典,给了我们警醒和经验,但新冠 ≠ 非典,且看时间会将我们带去哪?

DT财经:各行业扛疫能力大调查

时代数据:资本市场过山车应理性看待

谷雨数据:874万应届生:主动降低薪资预期,城市首选新一线

泽平宏观:疫情对中国经济的影响分析与政策建议

帝都绘:灾祸如何塑造城市?

趋势观察

数据,在疫情发展的每一个重要节点都留下了足迹,或答疑解惑,或记录现场,或探寻真相。观察了近200个数据作品后,在此将我们的观察分享给大家。

发挥优势,人人可以数据创作。我们曾在2019数据创作者大会上指出:数据创作者的身份日趋多元化,记者、设计师、程序员,还有“八卦”的人口学家、有趣的城市规划师、严谨的经济学家正参与其中……他们做事实核查,关注小众领域,发挥专业优势,不断拓宽着数据新闻的版图。

在这次疫情中,有民间自然保护机构-山水自然保护中心集结志愿者力量,分析野生动物非法贸易乱象,在#韩国人来青岛躲避疫情#的消息在网络上疯传时,关注航空领域的航旅圈第一时间以数据呈现事实,从不缺席的程序员Ele实验室模拟程序告诫大家不要出门,微博用户@江南剑心2组织网友自发绘制城市内部传播图,还有专注人口、城市、舆情、地理等创作者基于自身在专业领域的积累,不约而同展开数据叙事。

图源:@江南剑心2

数据共享,开源力量在行动。和蔓延的疫情相伴而生的,还有各类开源力量。确诊患者相同行程查询 、新冠肺炎小区查询等项目被广泛传播及使用,「本站数据接口和页面接受转发、嵌入、调用、下载」的说明又促进了项目的二次使用。又如澎湃新闻·美数课在疫情期间共享实时地图数据库及疫情明细数据,方便各界研究和报道。北京大学的疫情可视化工具也无偿开放给社会使用。

数据时代,多一些开源分享,或许就有多一些各学科、领域、人才间的碰撞创新。尤其期待未来看到更多机器学习、图像识别等计算机技术在新闻领域的使用。

共创时代,数据可以从哪里来?除了公开的政府数据、开源数据,商业力量也是数据生态中重要的一环。在这次疫情中,百度人口迁徙数据在分析人口流动路径时起到很大作用。外卖数据、电商销售量、APP下载数等商业数据,也间接展现了消费者在疫情之下生活状态的变化。此外,你的每一次在线操作,都在互联网上留下了足迹,社交媒体的数据当然不能错过。在这些作品中,我们还发现了不少来自问卷数据的新探索。当面向人群达到一定数量,保证样本科学的条件下,问卷调研可以弥补当疫情这类突发情况出现时,新数据的缺失。

可视化,为有精度地观察疫情而设计。在本次疫情传播中,首次与图表大家族会面。我们发现,疫情稿件中的可视化涵盖了95%以上的图表类型。除了常规条形图、折线图、气泡图等基本图形,网络关系图、日历图、南丁格尔玫瑰图等小众图表也被大众所熟知。更重要的是,好看之外,可视化高效准确地信息传达功能得到重视,如向帆融合数字技术与艺术设计,以时间和空间为重点探寻疫情表达方式,还有指数坐标等高阶玩法被应用,作者和读者间出现了更多专业性的讨论。

冷冷的数字背后,亦不缺人文关怀。相比文本、影像,数据似乎总给人冷冰冰的感觉,这也赋予了其理性、客观的特质。但当视角定格在《图释两千年传染病史:若瘟疫无法被根除,该如何与之相处?》一文时,人类与几千年的传染病纠缠史娓娓道来,不由让人感慨人类的渺小。我们用一片片花瓣表征一个个逝去的生命,为的是不忘却这场灾难中的每一个普通个体。数据说话,不仅是摆事实、讲道理,最终是为了讲述一个值得记录的「故事」。

抗「疫」尚未结束,数据的记录也在继续。

发表评论

电子邮件地址不会被公开。 必填项已用*标注