辅助功能设置

文字大小

色彩设置

单色 柔和色 dark

阅读工具

底部遮盖 标尺

图:Glenn Carstens-Peters / Unsplash

资源中心

» 章节 » 报道指南

主题

企业信息挖掘不完全指南(二):透过监管资料深挖企业信息

工商档案是企业信息的宝库,尤其对于非公众公司来说,挖掘其核心信息最基础的途径就是工商档案。近几年,随着中国官方对于企业信息公开的法规和执行不断完善,以及商业机构对企业工商信息的大数据挖掘,工商档案类信息获取的便利性和挖掘的价值都大大提升。

当然,这里指的是在网络中公布的工商外档信息,而工商内档信息随着工商管理法治化和隐私权利被重视,获取的难度提升和范围逐步缩减,但仍然具有极高的价值。这些内档存放在企业注册登记的监管机构,而且只能以纸质形式复制。调取企业内档需要经过比较复杂的程序,最好的办法是寻找一位在企业注册地附近的律师来付费协助调取。

目前,工商档案信息的范畴随着政府各个监管部门的信息公开步伐不断扩围,除了工商注册登记的法定备案内容,还包括行政信息(资质、许可、处罚等)、知识产权(商标、专利、著作权等)、司法信息、税务社保,甚至财务数据、人员招聘。

这些信息有的在政府内部被公示,有的被商业机构通过数据匹配聚合利用,形成了一个维度广泛的企业信用信息系统。虽然已经很难用工商档案来概括这些信息,但是把它们称作企业的档案仍然十分贴切。

官方企业信用信息公示平台

中国大陆的企业信息公开在最近五年经历了一个快速变化和完善的过程,从最初的各省区分治到商业机构深度参与,挖掘企业工商档案信息变得越来越容易。全国企业信用信息公示系统是中国监管部门建立的企业信息集中收集、公示和检索平台,它破除了各个省区市的地域企业信息隔离,也很大程度集纳了多个监管机构之间此前隔离的企业信息。

这个系统向所有公众开放,除了语言,可以说没有任何门槛。其权威性也得到政府背书,可以作为核心信源。不过随着访问量的增加和爬虫的增多,它的访问速度和防机器验证让人很难有好的使用体验。但值得高兴的是,它最近已经开始支持将查询的信息形成一个 PDF 报告并通过电子邮件发送给查询者。

使用这个系统,你需要做的就是以中文简体输入企业的名称(支持模糊搜索),查询得到的信息包括基础信息、行政许可信息、行政处罚信息、列入经营异常名录信息、列入严重违法失信企业名单(黑名单)信息。

这四个板块中,内容最丰富的还是基础信息,而行政许可和处罚信息则是来自诸如规划局、国土局、气象局、证监会、银保监会、消防等等各类政府部门;列入经营异常名录信息主要来自工商行政管理部门,最常见的原因是监管人员在企业注册地没有找到企业,或者是企业没有按时向监管机构提交必要的信息;黑名单信息则更多来自司法系统的认定。

信息量最丰富的基础信息中,从企业分支机构到登记变更历史,从发起人及出资信息到年报信息,从商标注册到动产抵押,你需要做的就是不断下拉去查看更多信息。需要说明的是,这里的企业年报信息虽然包括了企业资产状况等核心信息,但年报中大部分内容企业可以选择不公开,而且页面中有明确提示“企业年报信息由该企业提供,企业对其年报信息的真实性、合法性负责”,资产和财务数据明显不准确的情况非常常见。

在报道的应用上,要了解一家没有太多其他公开信息的企业,最基础的工作就是通过这个平台来查询,而且不放过任何一条信息。例如,我们能知道企业的出资者,注册资本规模(这个金额并不代表企业资金规模,但有一定参考性),各类来自监管机构的正面或负面信息,幸运的话可能会发现这家企业员工数,年营收等简单财务数据。

此外,基本信息的年报中包含了注册地址、通信地址和联系人电话或电子邮件。这些信息都值得去进一步查验,很多企业并不在注册地址办公(并不违反任何法规),联系电话和邮箱可能是一家注册代理机构的工作人员的,不过也有可能是企业核心负责人的。

需要说明的是,虽然全国企业信用信息公示系统涵盖了中国大陆全部省区市的信息,但在一些地方也会有当地监管机构运营的企业信息公示系统。这些地方公示系统的内容理论上和全国的系统是一致的,但也有特殊情况。例如,北京市和成都市都有自己的官方企业信息公示平台,而且它们公布的内容会比全国的平台更加详细。所以,去当地工商行政监管部门官网找找当地企业信息公示平台并尝试检索一下,或许会有意外的收获。

商业机构企业数据库

看到企业公开信息的价值之后,有很多商业机构在不断爬取政府公开的信息,并利用各类技术进行数据分析和可视化。目前比较活跃和成熟的商业机构有天眼查启信宝企查查,它们的数据来源几乎完全一致,就是各类政府信息公开平台,检索功能和分析模式也没有特别明显的差异。不过,它们也会收录并未以企业形式注册的经济实体,例如学校、NGO 等等。

图为某商业机构的分类检索选项,其中香港和台湾选项仅指出现在中国大陆官方系统的港台企业(如在大陆投资设立企业的港台企业)。

这些商业机构的服务对于基本查询功能大多是免注册开放使用,但略微涉及进一步的功能都会要求注册甚至付费购买会员(价格并不高)。作为最重度使用的用户之一,媒体记者是这些机构非常欢迎的用户,所以它们都会将大部分功能免费向媒体记者开放使用,甚至按照需求为媒体免费提供批量化的数据,用来制作数据新闻。

记者只需要通过网页上的渠道联系这些机构并证明记者身份(名片即可)就可以获得一个权限很高的媒体VIP账号。这些机构甚至会有专门的人员来服务记者需求、给予培训、针对性升级产品,因为新闻报道中对商业机构名称的露出是这些初创企业非常好的广告。

需要提醒的是,商业机构的信息在使用时需要谨慎验证,因为它们的信息并不是全部实时更新,海量信息匹配过程中出现差错也是难免的。作为商业机构,它们并不会为数据的延迟或差错承担法律责任。因此,在将商业机构查询到的信息作为核心信源时,从官方的平台做一次验证非常必要。

• 找到利益链条

穿透股权找到利益链条如何构成对于较为复杂的商业运作调查非常重要。

在官方的企业信息系统,每个企业的信息都是独立的,你可能需要查询很多家企业的信息才能知道一家企业最终是由谁在控制。商业机构在对企业信息进行匹配和可视化之后,这种查证变得非常高效,自动生成的股权结构图、股权穿透图能够节省大量的时间。

通过图形链条的设计,我们能够非常便捷的看到一家企业的股东关系和投资企业关系,加上对股权比例和股东权利的基础理解,就能够很快找出一个明确的利益链条。

• 从自然人挖掘企业信息

从自然人挖掘企业一直是调查报道中的一个难点,因为隐私保护和官方信息的不可逆查询,要找到一个自然人投资了哪些企业是一件非常困难的事情。商业机构的企业信息数据库很大程度上解决了这个问题。我们可以直接在搜索框内检索一个人名,然后就可以看到这个“名字”出现在哪些企业的信息中。

通过这种方式,我们能够很快查询出一个人在企业任职、投资的情况。但有一个问题是,匹配人和企业的关键连接只有姓名这个信息,而姓名的重名概率很高。商业机构通过一些对信息的数据分析能够识别一个姓名背后可能是很多不同的“老板”,但仍然没有办法确保信息完全准确,而这并不妨碍记者将其作为重要线索来进一步调查。

• 主动监控企业信息变化

主动监控企业信息的变化也是商业机构企业信息库带来的新玩法。你只需要在商业机构的产品上(APP、网页)选择将某家企业加入监控,这家企业的重要信息变化时,你就会收到一份邮件获得提醒,媒体用户的最大监控数量一般可以达到100家。

这个功能为很多的记者提供了一个非常丰富的新闻线索来源。例如,海外大公司在中国设分支、知名企业遇到诉讼、商业人物辞职退出、影视明星投资任职等等。

企业司法及监管信息挖掘

得益于中国司法和政务信息公开的进程,企业的司法和监管信息也获得很大程度的公开。和工商档案信息的原理类似,司法和监管信息除了官方的披露平台,也有不少商业机构对这些信息进行了抓取和数据处理,检索便利程度和使用便捷性都得到很大提升。

• 企业司法信息挖掘

司法信息中涉及企业的内容规模非常庞大,而且涉及司法案件的企业名称一般不会因为隐私限制而不被披露或部分披露。涉及自然人的姓名因为个人隐私限制往往会被特别处理,以“王某、李某国、张某某”的形式出现。因为中国大陆企业名称的唯一性(理论上不会有完全重名的企业),通过企业名称定位司法信息也变得非常精准和简单。

中国裁判文书网中国执行信息公开网是中国大陆主要的司法信息披露平台。它们的检索使用也非常简单,阅读官方制作的使用指南就能很快掌握检索技巧,目前除展示裁判文书的具体内容,还有裁判文书关联文书、目录、概要的展示。

一般来看,这两个平台披露的主要是已经完成或部分完成司法流程的案件,比如裁定、判决、调解、执行等文书。需要说明的是,除了这两个平台,中国大陆各个省区的各级司法机构还会在自己的渠道披露很多司法信息,比如开庭公告、经典判例等等。

商业机构的司法信息平台则提供了更多检索方式和初步机构化的呈现。无讼OpenLaw 裁判文书检索都提供非常好的检索体验,只需要邮箱或手机就可以免费注册使用这些平台,而且它们会收录来自更多司法机构的披露信息。此外,上文提到的提供企业工商档案信息数据的商业机构也会做司法信息的收集和匹配。

在利用的方式上,司法信息能够为新闻报道获取更多丰富的素材(案件细节),查清利益共同体或对立方(原告被告),甚至找到核心知情人(涉案人及代理律师)。同时,从司法案件的性质和频率也能够很大程度上判断一家企业经营的模式和风险。

• 监管机构备案的信息

企业的运行是处于一个非常精细的政府监管体系之下,企业的大部分行为需要在各类政府监管机构备案和审查,以确保企业经营活动的合法性。从获取资源到生产产品,从生产流程到销售渠道,从产品定价到消费者权益,从环境保护到安全质量,企业的核心信息都被监管机构掌握并部分披露。

根据中国政府信息公开法律规定,公民可以使用个人身份向持有信息的政府机构申请信息公开,渠道和方式也越来越便捷。只要你能够精确的知道需要的信息在哪个监管机构的哪份记录中,那么向监管机构申请信息公开是一种非常有用的尝试,尤其是在环境保护、食品药品安全等信息相对比较开放的领域。

想要查询到有价值的监管机构信息,首先需要的是理解体系复杂的监管机构的运作和分工。弄清楚哪一个环节、哪一类产品、哪一种资源是归属哪个监管机构管理,然后有针对性的去查询挖掘信息。虽然监管机构信息披露的水平层次不齐,但大部分内容是网络公开渠道可供查询的。以下是部分信息的监管机构查询网址,也许随着监管机构的升级,网址会有调整,但只要知道了信息来源于具体哪个政府监管机构就能很快找到查询渠道。

知识产权信息:

自然资源信息:

资质认证查询:

• 搜索引擎定向检索

在查询政府监管机构披露的信息上,有一个搜索引擎使用技巧非常实用“关键词+空格+site:gov.cn”。这个搜索语法的意思是检索特定关键词在 gov.cn 域名下的所有信息,而 gov.cn 是中国政府官方域名后缀。

通过这种方式,你可以用百度、谷歌等工具快捷的查询到监管机构披露的信息。需要说明的是,上文提及的知识产权、自然资源、资质认证等信息是处于一个更深度的数据库中,搜索引擎一般很难抓取到。但是,在这些深度数据库之外,监管机构往往会在官方网址披露很多有价值的企业信息,搜索引擎定向检索能够很快的发掘这些信息。

来自 gov.cn 的信息绝大部分都值得信任和援引(至少代表了监管机构的看法),但也并非没有干扰信息。有一些政府机构会在自己的官网转载媒体报道,也会有一些低级别政府机构在官网发布一些信息夸大的内容(有时也会无意中发布上级机构不愿发布的珍贵信息),这些信息都需要识别来源和核查判断。

通过产品和行业信息理解企业

企业的原料和产品所在市场的资讯机构,以及企业所处行业的研究机构也是企业信息的重要来源地。而这些机构大部分属于商业机构性质,获取其信息往往并不复杂,尤其是对于媒体来说,因为商业机构需要媒体来推广它们的研究内容。

多数情况下,作为原料的大宗商品(用于工农业生产与消费使用的大批量买卖的物质商品)是很多企业生产经营中的核心资源。在金融投资市场,大宗商品指同质化、可交易、被广泛作为工业基础原材料的商品,如原油、有色金属、农产品、铁矿石、煤炭等。大宗商品包括3个类别,即能源商品、基础原材料和大宗农产品。

因为被赋予了金融属性,这些大宗商品就有了专门的交易机构和研究机构。卓创资讯生意社这类大宗商品资讯和数据服务商会提供大部分大宗商品的公开信息,比如主要厂家、价格走势、市场分析等等。此外,卓创资讯和生意社等机构都会主动向媒体记者提供资讯和分析师采访资源。

从产品角度看,家用电器、手机、电脑等消费品,以及锂电池、半导体、液晶面板等半成品也会有很多商业资讯机构主动提供产销量、价格走势、供需分析等信息。找到一家相对成熟的商业机构并获取其资讯和分析是研究企业的一个很好的方式。

此外,商会、协会和联盟等组织也会对行业产业信息进行主动的披露,并且愿意通过媒体来传播讯息。它们一般会以公布报告、召开会议等形式传播信息,这也是媒体记者获取企业和行业信息的重要渠道之一,而且往往可以通过这些组织联系到企业的内部人员。


作者 岳琦 供职于中国大陆财经媒体《每日经济新闻》,带领记者团队以新闻专业职业操守和价值判断,报道中国北方区域上市公司及大型企业,同时关注产业经济和时政热点,探索融媒体生产和传播技术创新。

您可以根据知识共享协议条款免费转载这篇文章

转载


阅读更多

深度报道技巧

如何在 Twitter 上进行在线调查?

在进行调查报道时,Twitter 是一个常用的平台,你可以在上面找到特定对象的发言、互动和关系网络,但常用功能只是浮出水面的一小部分,开源调查专家 Henk van Ess 在这篇文章中,分享了在 Twitter 进行开源调查时鲜为人知却相当实用的功能。

深度报道技巧

黑市数据与新闻伦理:他们如何调查纳瓦尼中毒案?

俄罗斯反对派领袖纳瓦尼去年被投毒后,至今没有任何一个执法机构对这起案件进行调查。这时,调查记者们站了出来。来自英国调查新闻网站 Bellingcat 和俄罗斯 The Insider 进行了一项联合调查,证明了俄罗斯安全机构和该案的联系。在这篇文章中,调查记者们解释了为什么会使用黑市数据来协助调查,并探讨了其中的伦理问题。

深度报道技巧

如何对突发新闻进行开源调查?

在美国国会骚乱发生的同时,世界各地的开源调查记者们也迅速行动起来,抓取社交媒体帖文、将直播视频录下、并发起在线众包项目……为日后进行深入调查积累素材。在这篇文章中,两位资深记者以美国国会骚乱为例,和我们分享了对突发事件进行开源调查的十点技巧。