辅助功能设置

文字大小

色彩设置

单色 柔和色 dark

阅读工具

底部遮盖 标尺

文章

实用贴:如何用网络搜索搞定新闻要素?

book-cover2编者按:《调查报道信息核实手册》(Verification Handbook for Investigative Reporting)是一本有关网络搜索和调查技巧的新鲜实用指南,指导人们如何利用UGC(user-generated content, 即用户生产的内容)和开源信息进行网络搜索和调查。此手册由总部设于荷兰的GIJN成员“欧洲新闻中心”(European Journalism Centre)出版,共有10章,均可免费下载。以下是获得授权转载并编译的该书第2章,由网络搜索专家Henk van Ess编写。


网络搜索是传统调查记者、新闻教师和学生经常面临的棘手问题,因为网络信息可能不真实,有偏颇、或者不完整,这几个弊端也可能同时出现。

线下也是一样,给我们提供信息的人不可能毫无偏见,政府也做不到毫无隐瞒。无论线上线下,问对问题是关键。那怎么用网络搜索搞定新闻的三大要素(人物、地点和时间(3W))呢?专家告诉你有哪些好工具和巧方法,让你搜索不再愁。

1. TA是谁?(Who?)

试试用谷歌写出一份壳牌公司CEO Ben van Beurden的背景介绍吧:

a.寻找资料和评价

1

“is”这个简单的词是个神奇的小提示,能“命令”谷歌显示出和人物相关的资料和评价。为了避免结果杂乱,搜索时最好加上公司名称或其他细节,用AROUND指令告诉谷歌:这两个词离得近才行。

AROUND()指令必须大写,以保证搜索词之间的距离不超过两个词。

b.其他人的评价?

2

这个搜索指令让谷歌 “显示除了壳牌内部文件,还有哪些PDF文件含有壳牌CEO名字?” 所以最后出现的是与搜索对象相关、但不是由他/她公司发布的文件。你能看到反对者、竞争者和异议者对他的评论。如果你觉得还不够,不妨输入以下指令试试:

inurl:pdf “ben van beurden” –site:shell.*

这样你还能找到filetype找不出来的PDF文件。

c.官方数据库

3

再一步就是搜索全球关于他的官方文件。在网上搜索gov.uk(英国),.gov.au(澳大利亚), .gov.cn (中国), .gov (美国)和世界上其他国家的政府网站。如果你的所在国没有以.gov为结尾的政府网站链接,试试这样的组合:当地词汇+指令site: operator. 例如搜索德国的政府网站可以用:site:bund.de,要是荷兰的就用:site:overheid.nl。

按照此法,我们发现了van Beurden伦敦寓所的建筑许可证,按图索骥,就找到了他的完整住址和其他细节信息。

d.联合国资料

4

现在试试在联合国相关组织网站里搜索信息。还是以壳牌CEO为例,我们搜索发现,他的名字出现在一份关于“国际化学品管理战略方针”(Strategic Approach to International Chemicals Management)的文件里,由此找到了他的全名,妻子全名和当时的护照号码。神奇吧?

e.寻找名字的不同拼法

5

按照这个指令,你可以发现使用不同名字拼法的结果。你会搜到含有“壳牌(Shell)”字样的文件,但把称他为“Ben”的排除在外了。如此一来,你会发现他也被称为“Bernardus van Beurden”(你不必在名字里打点[.],因为点在谷歌搜索里是忽略不计的)现在Get到技巧了吗?不如换个名字,重新按照a,b,c,d的顺序试一遍吧。

2.TA在哪儿?(Where?)

a.使用Topsy的图片搜索功能

6

www.topsy.com 找出主人公所在的地点,用三项搜索条件锁定结果:分析他过去一段时间内(2)提到的地方(1),查看别人在Twitter上发的图片(3)。如果你想调查一个特定时间段,在时间菜单里选择“特定时段”(Specific Range)就可以了。

b.使用Echosec

7

你可以在Echosec上免费搜索社交媒体信息。比如搜索壳牌,我输入了总部地址(1),希望能找到近期(2)在那里工作的人所发的状态(3)。

c.使用谷歌图片搜索功能

8

把你知道的相关信息浓缩成一个精炼的词。在如下例子中,我想搜一位名叫@ MuhajiriShaam的伊斯兰圣战者(1),但并不想查Twitter(3)上名为@MuhajiriShaam01 (2)的账户。我想查看这个人在2014年9月25日到29日之间在Twitter上发的图片(4)。

3.TA在什么时间(做了什么)? (Time?)

a. 搜索日期

多数情况下,你的调查是以发生过的事实为基础。所以要告诉你的搜索引擎搜索过去的信息。

9

我们来调查一场发生在荷兰Chemie-Pack(一家化学工厂)的火灾,它发生的日期是2011年1月5日。假定你想调查工厂是否储存过危险化学品。登陆images.google.com,输入Chemie-pack(1),搜索2011年1月之前的图片(2)。搜索结果给出了上百张照片,都是几天前来过这家工厂的青年消防队拍的。在一些照片里出现了写着化学品名称的圆筒。我们以此能列出火灾前工厂里储存的化学品清单。

b. 用archive.org寻找旧数据

想必大家也经常碰到网站“404 not found”的囧事,除了掀桌,你还可以去archive.org碰碰运气。不过这招只有在你知道网站URL的情况下才管用。问题是网站失踪了,URL链接也就找不着了。这时想找回看似消失的URL,该怎么办呢?

我们有办法!假设要找已逝女演员Lana Clarkson的个人主页。

第一步:找到索引网页

找一个跟消失网页相关的消息源。这里我们就用她的维基百科页。

第二步:把索引网页放到“时光机”里去

登陆archive.org,输入维基百科页的URL: http://en.wikipedia.org/wiki/Lana_Clarkson

选中最老的版本:2004年3月10日。这个版本显示的个人主页地址为:http://www.lanaclarkson.com

第三步:找到原始网页

再把这个链接输入archive.org,加一个反斜线和一个星号,如下所示:
URL: https://web.archive.org/web/*/http://www.lanaclarkson.com/*

咻,现在所有的链接都蹦出来啦。但在这个例子里,你找不到很多她的信息。因为Clarkson在死后才出名。她于2003年2月被著名音乐制作人Phil Spector枪杀。现在方法到手了,快找一些头疼不已的例子试试吧。


 

henkpic  生于荷兰的Henk van Ess是资深客座讲师和培训师,他在欧洲多地开设网络调查工作坊,教授网络调查、社交媒体和多媒体/跨媒体内容。他参与的项目包括“网站信息核实(CSI Internet)”、《数据新闻手册》,以及社交媒体和网络调查专家的经验分享栏目

您可以根据知识共享协议条款免费转载这篇文章

转载


阅读更多

GIJC 侧记 GIJC23

#GIJC23 侧记:危险者的聚会

“如果把这两千多个人都消灭了,全世界的独裁者应该会睡个好觉。”在 GIJC23 现场,我们一直开这样的“地狱玩笑”,却又如同另类的集体心理诊疗。自由作者邹思聪在这篇侧记中讲述了三位俄罗斯流亡记者的故事——他们虽然再也无法回国,却在异乡坚持报道、建立生活。

GIJC 侧记 GIJC23

#GIJC23 侧记:哪怕空间再小,也不要停止做事

在参会之前,于月想知道这个世界上有没有哪些同行和我们一样处境艰难,又是怎样克服?在听到来自世界各地的同行分享后,她觉得哪怕空间再小,也不要停止做事。

GIJC 侧记 GIJC23 全球深度报道大会

GIJC 侧记:残缺的数据,模糊的面孔,天秤倾斜的判决——从女性杀戮报道说起

如今我们究竟需要怎样的报道?在影响力如此受限的当下,我们究竟如何定义和看待“impact”?在报道杀戮女性的分享中,独立记者易小艾找到了部分答案:有些记录,若没有留下,真的会丢,若还有一些力气,就一起守住每一个留下记录的可能吧。