辅助功能设置

文字大小

色彩设置

单色 柔和色 dark

阅读工具

底部遮盖 标尺

文章

搜信息,助协作:数据检索利器Aleph特色一览

社会议题走向全球化,调查报道跨境协作也成新潮流,国际有组织犯罪和腐败报道项目(OCCRP)开发的新工具Aleph就是协助跨境报道的利器。用户可通过其上传文件、共享、搜索、抽取关键信息。想了解Aleph的背景和特色?调查协作工具的发展方向是什么?以下便是Aleph设计者Friedrich Lindenberg的设计心得。还可以参考他分享的《调查记者专用:数字信息调查工具清单》


在小说家博尔赫斯的短篇故事里,Aleph(阿列夫)是一个包含万物的空间点。看到它的人能立刻通悉全宇宙——想必也是调查记者渴望拥有的技能。

过去半年间,我为OCCRP设计了一款数据研究工具,以Aleph命名。这款工具的原型,其实是我参加2014奈特国际新闻奖学金项目时创立的一个工具模型。它现在成了协作、处理工具Investigative Dashboard的一部分。

1

Aleph能帮记者检索大量源文件,包括以前的报道、公司的注册资料和政府宪报(政府宪报,以香港特别行政区政府的宪报为例,是香港政府发布公告、启事及法例等的官方出版物)。

 

简洁检索,持续监控

在Aleph简洁的检索框里,用户可以搜索海量文件和数据表。ID搜索功能整合了100多个数据源,包括美国国务院电报,吉尔吉斯斯坦公司注册信息,卢森堡、列支敦士登、瑞士等国的政府宪报,英国议会对俄罗斯安全局前职员亚历山大·利特维年科毒杀案的调查质询(利特维年科曾在克格勃和俄联邦安全局供职,曾就车臣问题大肆批评总统普京政权。2006年,他在伦敦一家高档酒店喝了掺入放射性物质的茶水后被毒死。英国警方1月21日公布的一项调查声称,俄罗斯总统普京很可能是利特维年科毒杀案的幕后主使)。

此外,任何用户皆可在Aleph创建自己的私人文件集——整合内容可以是文件、数据库、扫描件,或是归档邮件。Aleph还可以根据大规模监控列表对照文件,列表包括世界各地的制裁名单、通缉犯、政客,以及此前接受过调查的任何人物和公司。

2

Aleph在数据库的实体监控名单整合了数据、政客信息和以前报道的主题

 

渐渐地,Aleph也可从文件抽取电子邮件地址、电话号码、网址等结构化信息。它也将在近期增加银行账户、增值税登记号码、日期、基金账户等信息的入口,用户可有更多方式分析、筛选数据,找到所需信息。

注:结构化信息指信息经过分析后可分解成多个互相关联的组成部分,各组成部分间有明确的层次结构,其使用和维护通过数据库进行管理,并有一定的操作规范。我们常接触的数据库所管理的信息,包括生产、业务、交易、客户信息等方面的记录都属于结构化信息。

3

谁在监控名单上?Aleph让记者养成“监控”的习惯,选取感兴趣的公司和人物组成列表,加以维护

 

记者也可通过创制“自定义名单”(custom watchlist)系统性地跟踪个人和公司。如果新上传文件或新公共数据源提及列表里的公司或个人,记者就会收到系统提醒。

4

像政府宪报这样的数据来源会每隔一段时间自动更新,Aleph还会通知用户监控新的名单匹配信息。

 

助力协作,兼顾长远

Aleph旨在从日常工作和长远战略角度协助做调查检索的用户。在日常工作中,Aleph能帮你找到新的报道主题,或者在调查中协助分析大量泄密文件。

从长远来看,它也在协助记者建立鲜活档案——档案中既包含信源材料,也含有感兴趣的人物和公司的结构化信息。将结构化信息和非结构化文件并列检索,是Aleph正在尝试的新领域。

5

根据以前的调查建立详细、结构化的数据表,可让用户更好地参照文件和实体信息

 

Aleph能协助个人和组织跟踪他们已知的实体和所需信息,也为研究员协作提供了好方式。Aleph 设置的“窥视”(peek)功能,可以将私人文件持有者和在文件中查找信息的用户联系起来,以后也有望实现工具链接,例如链接到同类工具DataShare。

6

让用户“窥视”个人文件集有助于相互协作

 

为调查工具包做尝试

Aleph的核心设计理念是服务于实用研究需求:快速找到关键文件,获取新信息提醒,或罗列出某篇报道的主要人物。

这个项目最难的地方在于,如何将上述搜索转化为大家愿意参与的日常合作。如果短时间内找不到有效、实用的信息,大部分调查者会弃用数据管理工具。

此前我写了一个软件Grano绘制事件的影响,而Aleph是它的进化版。做Aleph,是因为我们想尝试制作以任务为重的工具,为以后开发调查报道实用工具包打下基础。

Aleph是免费软件,它诞生自Code for Africa,现在被OCCRP的ID团队和OpenOil采用。我们乐于见到更多组织和公司应用Aleph,引入更多功能


本文原刊于Friedrich Lindenberg的个人网站,全球深度报道网经授权转载编译。

pudo-768x515Friedrich Lindenberg是程序员和数据记者,专注于新闻叙事和调查技术的网络科技。他是2014 美国美国国际记者中心奈特国际新闻研究员,也是德国明镜网站2013 Knight-Mozilla OpenNews研究员。

编译/周炜乐
编辑/王一苇

您可以根据知识共享协议条款免费转载这篇文章

转载


阅读更多

GIJC 侧记 GIJC23

#GIJC23 侧记:危险者的聚会

“如果把这两千多个人都消灭了,全世界的独裁者应该会睡个好觉。”在 GIJC23 现场,我们一直开这样的“地狱玩笑”,却又如同另类的集体心理诊疗。自由作者邹思聪在这篇侧记中讲述了三位俄罗斯流亡记者的故事——他们虽然再也无法回国,却在异乡坚持报道、建立生活。

GIJC 侧记 GIJC23

#GIJC23 侧记:哪怕空间再小,也不要停止做事

在参会之前,于月想知道这个世界上有没有哪些同行和我们一样处境艰难,又是怎样克服?在听到来自世界各地的同行分享后,她觉得哪怕空间再小,也不要停止做事。

GIJC 侧记 GIJC23 全球深度报道大会

GIJC 侧记:残缺的数据,模糊的面孔,天秤倾斜的判决——从女性杀戮报道说起

如今我们究竟需要怎样的报道?在影响力如此受限的当下,我们究竟如何定义和看待“impact”?在报道杀戮女性的分享中,独立记者易小艾找到了部分答案:有些记录,若没有留下,真的会丢,若还有一些力气,就一起守住每一个留下记录的可能吧。