辅助功能设置

文字大小

色彩设置

单色 柔和色 dark

阅读工具

底部遮盖 标尺

文章

报道亚洲 | 数据新闻走向何方?“故事为核,跨界合作”

我们如今生活在一个“大数据时代”,全世界的政府、企业、甚至个人每天都在制造海量数据。“数据新闻”应运而生,越来越多的记者开始投身到这片新闻蓝海中,挖掘藏在数据中的“新闻价值”。那么当下数据新闻的趋势如何?数据新闻的未来又是什么样子呢?

第二届亚洲深度报道大会上,深度君邀请到了英国《卫报》的数据项目编辑 Helena Bengtsson,伊利诺伊大学奈特企业与调查报道项目教授 Brant Houston,以及前路透社香港分社数据新闻编辑 Irene Liu。三位资深数据记者坐而论道,畅谈数据新闻的过去和未来。


数据新闻将去向何方?

irene-by-milan-poudel-336x224

Irene Liu (左),摄:Milan Poudel

Irene Liu:未来,数据新闻会延伸到各个生活的方方面面,我认为这也正是它令人兴奋的地方。数据新闻近年来的发展蒸蒸日上,我看到很多新工具不断涌现。这些工具能令记者们的工作更加便利,帮助他们发掘以前接触不到的数据资源。不仅如此,当下“数据”的概念也发生了巨大变化。我们曾经认为只有电子表单上那些数值型信息,才可以被称为“数据”;但是现在,“数据”可以是网络上任何非结构化的信息。

但是不论工具如何发展,数据的概念如何变化,我认为数据新闻的核心是不变的——用数据讲故事,和对权力问责。只要秉承这个初心,那么只有天空才是我们的极限了。

Brant Houston:我觉得数据新闻的未来可能会走向更高级的算法领域。诸如聚类(clustering)、主题模型(topic modeling)等高级算法,已经被应用到自然语言处理(NLP)技术中了。面对庞大的文本数据集,这些高级算法可以帮我们发现其中的主题或特征。

为了从海量数据中发掘出想要的信息,数据记者们也需要借助一些平台或工具,比如利用网络社交媒体的信息进行数据新闻报道,这是我们已经在做的事情。今后我们将会面对更多非结构化的数据,数据新闻要做的就是把它们变成结构清晰的内容,发现其中的价值。

Helena Bengtsson:数据新闻如今正在向两个方向前进。第一个方向是跨领域合作。当我刚开始做数据新闻的时候,所有的工作都由记者一个人来完成;而现在,记者可以和工程师、设计师一起合作完成项目,事半功倍。

从故事的方面来说,我希望数据新闻的第二个方向是,能处理更大、更加非结构化的数据集。 目前我们尚未有能力处理大批量文本内容,但这是我们努力的方向。今年,一份有关国际投资的跨境调查以其涉及数据之庞大震动世界。某种程度上,我希望我们十年后才拿到这样一份数据,因为到那时,技术的发展应能让我们做出更多有价值的新闻故事。

 

数据记者面临最大的挑战是什么?

helena-1-336x224

Helena Bengtsson, 摄:Aseem Banstola

Bengtsson:我觉得是不被理解。现在仍然有很多人不清楚我们在做什么,也不知道我们为什么要做这些东西。我从1997年开始从事数据新闻,我工作的一部分内容就是向我的同事们普及数据新闻的概念。即使在《卫报》,我也一直在做这件事。向同行启蒙和普及数据新闻是我的主要工作,我会告诉他们,数据新闻都在做什么,以及数据新闻的价值和意义。

Liu:我认为可能是对数据的认知。现在有很多人认为,数据是客观的,而人和机构都是有偏见的。但事实上,数据也是由人和机构创造的。所以我们对待数据要始终保持质疑的精神。与此同时,数据记者也要意识到,自己的假设、先入为主的观念以及不自知的偏见也会影响他们处理这些数据资源。所以不论我们的对象是谁,个人也好,数据也罢,记者们都要时刻保持警惕,保证故事的可靠性。

Houston:当我刚进入这个领域的时候,数据新闻是很简单的。你只需要掌握一些数据库管理软件,几个数据清理的工具,再加上一点基本数学知识就可以了。但是现在,这个行业对数据记者的要求提高了。如果想要拿到一些数据,你可能必须要从网页上进行爬取数据,然后你还需要做数据清理、结构化等工作。

对数据记者来说,另一个重大的挑战来自政府官员。有时候,政府并不会向记者提供他们需要的数据。数据新闻归根结底就是信息的争夺,记者如何与政府官员斗智斗勇已经是一个老生常谈的话题。作为一个记者,比起从前的文件档案,我更喜欢现在的电子数据。因为电子数据就像水流一样,很难被完全封闭起来——总会发生“泄漏”。

 

当下的数据新闻中最令人激动的事情是什么?

Liu:数据新闻的跨地域、跨组织交流合作一定是最令人激动的事情之一,这也是数据新闻之后的发展方向。我们生活在一个全球化的世界,大家在创作数据新闻时遇到的困难,已经超出了媒体和国家的界限。当下,资源越来越紧缺,而我们对新闻价值也有着越来越高的追求。想要生产出具有影响力的数据新闻,唯一的方法就是通力合作。数据记者们必须携起手来,共同应对挑战。

Houston:我已经在数据新闻领域工作了整整

brant-by-aseem-banstola-336x224

Brant Houston, 摄;Aseem Banstola

30年了。对我来说,现在看到有这么多人从事相关工作,有这么多关于数据新闻的职业培训,而且数据新闻甚至走进了大学课堂,这本身就是一件很令人激动的事。

数据新闻对我来说,核心永远是故事。如今的数据记者不仅擅长传统分析,还懂得使用合适的呈现方式,让新闻故事更具可读性。从一开始的不被人理解,到现在涌现出这么多优秀的数据作品,回首数据新闻的发展历程,一路走来令人感慨万千。

Bengtsson:最令我兴奋的应该是自然语言处理技术,以及在大规模非结构化文本数据领域的技术进展吧。很多语言学家也加入到了技术的开发工作中,目前已有能处理自然语言的脚本文件,但这仍是起步阶段。

机器学习(Machine Learning)是另一个令人兴奋的领域。机器学习,简单来说就是先用少量的文本信息“教”计算机如何处理数据,然后再让它按照之前学习的模式,批量地处理大规模的文本信息,最终得出一个有效的结果。虽然至今我还没有发现有哪些新闻作品成功地运用了这项技术,但我相信这是一个很有趣的领域,值得人们继续关注。

 

你最喜欢的工具是什么?

Houston:我喜欢数据库管理软件,或许是因为我一入门就用那个。

Liu:到目前为止还是Excel。

Bengtsson:我最喜欢的工具还是Excel,它也是我使用最多的工具。

 

 

编译/程一祥

编辑/Ivan Zhai,梁思然


headshotslgiordano_7905-e1474547218933-140x140

 

Adiel Kaplan是常驻美国西雅图的自由调查记者,目前为当地Crosscut, Seattle WeeklyInvestigateWest等多家媒体供稿。

 

想知道更多会议干货?请关注全球深度报道网(cn.gijn.org),微博@全球深度报道网及其话题#报道亚洲16#、微信“全球深度报道网”(ID:gijn_cn),Twitter @gijnCh带来的系列分享。我们的最新报道有:

《调查报道,联结亚洲——第二届亚洲深度报道大会开幕》

《报道亚洲 | 传感器与无人机在新闻中的应用》

《报道亚洲 | 视频新闻,如何用影像驱动调查与还原真相》

《报道亚洲 | 忘掉奥斯卡,听“聚焦”小组编辑现场讲述调查项目管理》

《报道亚洲 | 查IP、找图片、析商业:BBC专家网络调查工具秘籍》

《报道亚洲 | 如何科学质疑“健康专家”?前世卫发言人为你分享技巧》

《报道亚洲 | 顶尖调查记者的数据处理与可视化利器推荐》

《报道亚洲 |政府公开数据哪里找?普利策奖得主“调查宝典”全收录》

您可以根据知识共享协议条款免费转载这篇文章

转载


阅读更多

GIJC 侧记 GIJC23

#GIJC23 侧记:危险者的聚会

“如果把这两千多个人都消灭了,全世界的独裁者应该会睡个好觉。”在 GIJC23 现场,我们一直开这样的“地狱玩笑”,却又如同另类的集体心理诊疗。自由作者邹思聪在这篇侧记中讲述了三位俄罗斯流亡记者的故事——他们虽然再也无法回国,却在异乡坚持报道、建立生活。

GIJC 侧记 GIJC23

#GIJC23 侧记:哪怕空间再小,也不要停止做事

在参会之前,于月想知道这个世界上有没有哪些同行和我们一样处境艰难,又是怎样克服?在听到来自世界各地的同行分享后,她觉得哪怕空间再小,也不要停止做事。

GIJC 侧记 GIJC23 全球深度报道大会

GIJC 侧记:残缺的数据,模糊的面孔,天秤倾斜的判决——从女性杀戮报道说起

如今我们究竟需要怎样的报道?在影响力如此受限的当下,我们究竟如何定义和看待“impact”?在报道杀戮女性的分享中,独立记者易小艾找到了部分答案:有些记录,若没有留下,真的会丢,若还有一些力气,就一起守住每一个留下记录的可能吧。