计算机辅助报道:用数据挖掘真相

Print More

nicar-houston-website2编辑按:1995年,当《计算机辅助报道》第一版问世的时候,数据新闻还处于刚起步的阶段。不过越来越多的新闻人发现,在搜集、分析材料以及呈现故事的过程中,计算机可以扮演重要的角色。本书作者Brant Houston就是其中一位先锋。20世纪80年代和90年代初期,他在美国报社从事利用数据进行报道的项目。1994年,Houston 加入调查记者与编辑协会(Investigative Reporters and Editors,IRE),负责国家计算机辅助新闻报道协会(the National Institute of Computer-Assisted Reporting, NICAR)的工作。他扩展了协会的规模,使之从一开始仅有的几个数据培训班发展为每年五十个工作坊。计算机辅助新闻报道(CAR)由此先是在美国掀起热潮,随后在其它国家也开始大受欢迎。譬如,前不久今年3月举办的NICAR年会就聚焦数据新闻,吸引了近1000名参会者。(点这里查看相关的幻灯片、链接和教程。)


Houston喜欢把调查报道称为“新闻的研发部门”,而媒体目前对数据新闻的广泛接受,无疑证实了他的观点。过去二十多年里,《计算机辅助新闻报道》一书培育了成千上万名记者,开启了数据驱动新闻(data-driven journalism,DDJ)的全新时代。在新近修订的第四版中,Houston扩充了早前版本的内容,全球深度报道网很荣幸地在此可以重新发布该书的序言,让我们以新视角去了解如何在调查报道中使用计算机工具。


真正的革命发生在计算机辅助报道领域。从庞大的分析项目到新闻采集的细枝末节都在经历变革。新工具新技术使记者能赶在截稿前挖出关键的信息,迅速增加故事深度,并补充背景。

——“如今人人都是电脑迷”,Joel Simon和Carol Napolitano,《哥伦比亚新闻评论》(1999)

计算机辅助报道为记者提供了从数据中挖掘真相的机会,由计算机做出的比较分析常常能使人发现问题间的相关性。记者学习计算机辅助报道的收获在于,他们可以为读者提供知识和洞见,从而使其避免被武断意见所干扰,以及对名人判断的执迷。计算机辅助报道不仅能让小型新闻机构向周边的读者和观众发声,而且还可助其探究那些足以影响全球社会的大问题。

——“计算机辅助报道的益处”,Jason Method, 《尼曼报告》(2008)


data2上面这两句话,第一句虽然写于20世纪末,但在我们进入21世纪后依旧适用;第二句比第一句晚出现约十年,它说明计算机辅助报道在建立可信度和体现新闻全球化方面,都起到了重要的作用。不过仅就“数据”而言,无论在一般基础层面还是更高的层面,新闻业的革命仍在继续。

过去十年里,具备分析功能的软件越来越简单易用;在网上,有大量方便下载的数据;而通过硬盘、闪存和“云端”,存储空间也已变得极其巨大。短短几年时间,电脑、平板和手机的运算能力都得到大幅提高。用数据可视化来协助理解和分析,已经成为对未来新闻人的要求。此外,新一代程序员已加入新闻业,他们与传统新闻人一道,力图解决抓取、清理和组织网络数据时出现的问题,创造出吸引眼球的形式,向大众分享成果,并鼓励公众参与数据分析。

不过与此同时,很多基本情况并没有改变:数据库仍是人工创建,难免有人为的疏漏和错误,必须加以记录和订正。另外,每个数据库的时效性也都不长,一旦人们获取并使用了数据,它就过时了。

另外需要指出的是,单独一个数据库成不了故事。数据库就像一块遍布信息的田地,需要认真、深度地耕耘和谨慎地处理,新闻人还需要通过观察和采访来比较及扩充数据。

farm-subsidy-771x874

由EU Transparency建立的Farmsubsidy.org是记者和活动家们发起的一项运动,它的数据包括欧盟成员国提供的农业补助详情。

与以往相比,使用数据库前判断其准确性变得更为重要;而同样重要的是,分析数据时一定要小心谨慎,因为一个小错误就可能导致错得离谱的结论。事实证明,即使把数据传上了网,公众或志愿者也并不会因此就能合理分析。现在,我们更需要踏实肯干的记者而不是能说会道的游说家,需要他们在充分研究并理解信息和数据后加以诠释,并能用数据讲述引人入胜的故事。不过,尽管技术已经得到发展,人们也能获取海量数据,一些新闻从业人员所常遇到的工作场景并没有改变。

本书为读者所展现的,就是一些用于上述“不变场景”的技术,我们称之为“计算机辅助报道”,简称为“CAR”(“机辅报道”),它们是日常报道的一部分。新闻人将CAR和其它技术应用于自己每天的工作、专题报道以及那些可以获得普利策奖的大项目。

新闻人在键盘前敲故事或浏览网页并不是计算机辅助报道。真正的机辅报道指的是,为了给日常新闻提供更全面背景和增加深度而下载数据、分析数据,这就是在技术的协助下,以更开阔的视野、更深入的理解来报道复杂的故事。很明显,一个搜集了15万份法庭记录并获得了相关知识模式的记者在进行报道时,会比每周只看几个案件资料的记者更胜一筹。

计算机辅助报道并非是要替代已有的新闻操作方式,它其实已融入其中。机辅报道要求记者担当更多责任并更具警觉性,我们在基础新闻课上学到的经典标准——“核实、核实、再核实”——变得更为重要,“适度质疑”、采访多个信源、交叉引用等理念,也都比以往更值得重视。

puzzlecloud-771x578三十年前,计算机辅助报道领域的先驱之一Elliot Jaspin曾警告说:“计算机没法把烂记者变成好记者。它所做的,是让好记者更上一层楼。”很多一线记者在过去20年里接受培训,能熟练运用基本的计算机辅助报道技巧。他们战胜了对计算机和数学的恐惧,正将这些技巧运用于日常报道,从而使报道更严谨、更缜密。

通过分析数据库而进行新闻报道的倡导者Philip Meyer曾说过:“机辅报道抬高了培养记者的成本。”不过互联网和社交媒体的迅速扩张,成本低廉、使用便捷的计算机和软件的升级换代,以及编辑部对数据的价值和相关分析技术的越来越重视,都对机辅报道技术的广泛应用和不断进步起到了推动作用。

计算机辅助报道已不再是主流新闻的补充,而是新闻人在21世纪生存下去的基本能力。这些机辅报道工具无法代替优秀记者的想象力、他们进行深度访谈的能力和以及发展信源的天赋。不过,一旦新闻人懂得如何在日常工作和长期项目中使用电脑,他们就能更快速地搜集和分析信息,也能更深入地创作和发布故事。通过运用这些工具,记者在采访前的准备工作就会做得更充分,报道会也更具有权威性。他们还可能会受到启发,从数据中发现从未想到过的故事。

掌握了这些技能,新闻人就能取得政客、官员和商人所拥有的那些信息优势——后者享有这些优势仅仅是因为他们无论在资金还是知识上,都比新闻人更早掌握利用数据库和数字化信息的技巧。政府官员和职员们已经习惯把信息输进电脑,并对其进行检索和分析;在商业领域,无论是什么规模的公司,使用电子表格和数据库软件早已是再常规不过的事情;甚至连游说团体也懂得利用数据资料来推动自己的议程。

如果对数据分析的优势和劣势缺乏基本了解,新闻人就很难理解和报道当下的世界,他们希望从事有意义的的公共服务式新闻业或扮演必要的监督角色也会难上加难。

offshore多年以来,新闻人就像动物园里的动物,等着“管理员”喂信息,那些“管理员”们则乐于看到记者呆在与技术隔绝的笼子里。不过好记者总想看到原始信息,因为每当他人对信息进行选择或分类时,就有机会编造事实或添加偏见,旁人对此难以辨识,计算机辅助报道则可以避免这类情况的发生。

由于现在官方文件和商业记录大多以电子格式存储,很多新闻人和新闻专业的学生都已意识到计算机辅助报道的基本工具是获取信息的最佳方式,于是开始学习如何使用这些工具。尽管存在安全方面的顾虑,但政府和国际网站上仍公布有大量数据库,因此,记者如果不具备处理电子数据的能力,就无法获得最好的、原始的信息。旧时代的记者总是都无法及时获得这些信息,而更糟糕的是,他们会被竞争对手毫无顾忌地超越。

掌握计算机辅助报道知识还会给新闻人或新闻专业的学生带来求职优势。在很多新闻机构的招聘中,申请者如果具备这些技巧(当然不只是会上网浏览信息),他们的简历就会脱颖而出。

虽然机器辅助报道很重要,但新闻人不一定要成为程序员或者会写代码(尽管这也会有所帮助)。如果新闻人懂得使用电子表格或是数据库管理工具,他们已能自由搜索并核查信息,然后再考虑这些数据与相关采访及现场观察之间的关系。如此一来,他们就可以去除信息中那些令人混淆的部分,更接近真相。记者不一定是统计学家,但是好记者通常熟知统计学基本知识,知道数据可以被轻易操纵或伪造。同样,如果记者知道数据是如何受到操纵的,他们就可以更好地判断官员是否在混淆事实,政府是否有误用数据库。

keep-calm2记者还发现,如果他们让一个只会处理数据的人分析数据,就可能忽略数据的微妙之处和隐藏的错误。数据程序员并不一定会像记者那样思考,对记者来说很重要的东西,对程序员可能是微不足道的。让数据程序员包办所有事情,就像另外找个人读书给你听一样,意义不大。

严谨求证的记者也不希望陷入核实证据的死循环:索要固定数字格式的文件、研究文件、发现更多问题、然后索要另一个文件……与其花那么多时间来来回回,为什么不通过自己的电脑找到数据,并进行快速、多角度的分析呢?

最重要的是,计算机辅助报道是公共服务式新闻和每日报道的核心。无论是报道教育、商业、政府还是、环境等话题,都是如此。


41BZbkJpsTL._SX341_BO1,204,203,200_本文节选自由Brant Houston撰写、刚刚发行的《计算机辅助报道:实践指南》第四版,经出版商Routledge授权重印。

houston-headshotBrant Houston(@branthouston)是美国伊利诺伊大学厄巴纳﹣香槟(University of Illinois at Urbana-Champaign)奈特讲席教授,负责调查报道和企业报道(http://media.illinois.edu/knight/index)。该项目由奈特基金会(John S. & James L. Knight)设立。同时,他也是全球深度报道网的董事会主席,负责社区新闻项目CU-CitizenAccess.org。1997年至2007年,他曾任调查记者与编辑协会的执行总监。他还是《计算机辅助报道》一书的作者。

Leave a Reply

Your email address will not be published. Required fields are marked *