在公开信息中寻找蛛丝马迹,“风报” 要利用数据分析为企业提供情报

在关于企业信息的数据供应商中,我们曾报道过一款企业信息查询工具 “启信宝”,这家诞生于去年3月 的产品在六个月的时间里,从一个微信服务号扩充至 iOS、Android、Web 客户端,并于 9月 份获得 3000 万融资,目前已涵盖了全国 7500 万家企业的信用信息。

在占据行业领头羊地位相当一段时间后,启信宝要面临另一位竞争者的异军突起。在去年9月15日,也就是在启信宝刚刚获得新一轮融资的时候,另一款基于政府公开信息、媒体信息、社会信息的企业情报系统 “风报” 正式发布。

和启信宝通过征信中心与连接相关征信网站数据接口的获取方式相比,风报对企业信息的搜集则是依托了它们前期建立起来的核心自然语言分析技术 “玻森数据”,利用散落在全网中的企业外部文本数据,从海量的企业事件角度切入,展现企业及其管理者的情报,挖掘潜在风险。

在风报的创始人及 CEO 李臻看来,仅仅用 “企业数据查询” 来描述风报的功能有些单薄,他们更愿意用 “企业情报分析” 来形容这款系统,事实上,风报的诞生也不是一蹴而就的。2012年4月,风报的母公司玻森数据上线了全套 NLP(Natural Language Processing 自然语言处理系统)引擎及语料数据库,专注于自然语言处理技术的研发及应用,并使用这套系统为汽车、快速消费品等品类进行市场反馈、产品研发等方面的数据支持。

这听起来似乎很晦涩,但落实在现实操作中其实不难理解,玻森曾为大众点评上面的某个商家进行过口碑方面的典型意见分析,通过对非结构语言的转化以及词性色彩的判定,能够为餐厅提供在服务、消费场景、品牌个性、价格等方面的建议。

在玻森数据引擎的支撑下,李臻与其他合伙人进一步开发了风报产品,以面向企业信息查询这一垂直细分领域。在李臻看来,政府对公开信息的扩大化也是促进他们推出风报系统的另一点原因。

“有 80% 的商业情报都以非结构化的自然语言文本形式存在于网络的各个角落,但没人处理这些信息。” 李臻对 36 氪说道,不论是政府公开信息,还是公司的热点事件,这些文本内容都夹杂在政府官网、新闻媒体、社交媒体等位置。

通过对非结构化数据的挖掘,风报要做得就是定位于工商、涉诉、税务、行政处罚、投融资、高管变动、企业经营业务等重大事件报道,对企业交易对手、竞争对手、合作伙伴、行业公司直接进行审查评估。

比如在风报系统中对乐视网信息技术(北京)股份有限公司进行搜索,页面中就会出现一栏非结构化事件的信息分类,一栏以时间轴分析事件分类的企业动态,这种多信源、跨数据源的信息聚合,能对企业在经营过程中的关联信息进行集中展示。

对于企业与企业、企业与个人之间的关系,风报还可以通过对司法文书的语义分析,得出隐藏在他们背后的关联体系,目前 “风报” 系统为用户提供三类关系的挖掘:分别是基于法律关系的多层企业投资及被投资关系;基于司法的企业与企业或个人间涉案关系;基于海量重大事件的企业间关系。

当谈及与 “启信宝” 的差别,李臻当即为我进行了两款软件的使用对比,在对某一公司的信息查询中,风报能够的法律文书信息为 730 条,而启信宝提供的信息数量为 400 余条,另外,风报能够实现的时间轴、交叉系统展示也是启信宝暂时没有的。

不过,从目标受众来看,启信宝拥有更多的 C 端用户,其企业查询服务也为免费使用。风报则定位于纯企业端用户,以收取 5 万 8、13 万 8 至百万不等的年费实现营收,目前已积累了 400 多个企业用户。

目前风报已完成数千万级的 Pre-A 轮融资。团队方面,风报联合创始人李臻是一位连续创业者,在商务拓展与政府合作中积累了颇多资源;纪敏曾长期服务于知名咨询公司及上市公司,具有丰富的商业经验;另外两位联合创始人闵可锐、赵迎宾均毕业于知名高校,在海外深造后回国参与风报的技术团队打造和产品研发。

本文转自d1net(转载)

时间: 2024-08-31 03:29:13

在公开信息中寻找蛛丝马迹,“风报” 要利用数据分析为企业提供情报的相关文章

从Social Media海量数据中寻找专家的五大手法

郑昀 20090901 从海量信息中寻找专家,发掘或放大他们的影响力,在Blog 时代甚至BBS 时代,就有不少努力.当然,那时基本靠人或编辑.中国的编辑们最喜欢做这样的事情,罗列一堆的专家或写手作为导航入口.然而随着时间流逝,如果你逐个名字点击过去,要么久已不更新,要么已经变成了XX营销的软文集散地,要么还在更新但味同嚼蜡. 在Social 时代,由于传播更为迅速范围更广,用户也相对出于自愿传播,所以很多寻找专家的旧手法都可以通过更有效的数据获得验证.那些早期创了牌子后来又只打算借这块牌子赚钱

oracle RMAN备份报错的诊断过程(二)跟踪错误信息及寻找定位问题的方向

今天检查数据库中的备份输出脚本时,发现RMAN备份出现了错误. 这一篇跟踪错误信息,寻找定位问题的方向. 根据前面的问题描述,发现问题越来越复杂,从一个简单的RMAN备份报错,牵扯到系统中有3个长时间运行的JOB,以及RAC环境当前节点存在了大量的RACGMAIN CHECK进程的存在. 虽然问题很复杂,就不要急于盲目操作,先简单分析一下当前的状况. 发现问题是由于RMAN备份脚本报错造成的,但是根据错误信息和随后的测试发现,问题是可以重现的,并不是简单的RMAN问题,导致问题的原因应该是共享资

风报:让机器看懂企业情报

 在8月13日的云栖TechDay创投专场上,玻森数据CTO闵可锐为我们带来了一场别开生面的讲座,他主要介绍了人工智能在实际产品中的运用以及其背后隐藏的技术--自然语言的处理. 以下是现场分享观点整理. 本次分享分为两部分,第一部分简单介绍风报在企业的情报分析上能够达到的效果:第二部分和各位分享下开发风报时技术层面的挑战和一些算法上的具体实现,包括新闻语音相关性的计算,关系抽取计算等. 风报在企业分析中的定位是一个SAAS平台的企业服务,在该平台上我们沉淀了大约3000万家国内注册的企业,围绕这

如何在设计中寻找产品的性格

在前一文发表之后,我收到了不少邮件,有点出乎意料但又在猜想之中的是,这些邮件之中交互设计行业远多于工业设计行业,互联网行业远多于实体产品行业,而我仍想从事实体产品的工业设计. 但我也确实对交互设计对互联网非常感兴趣,甚至有意愿涉足,这种想法来源于对设计行业的变化的认同和理解.设计发生变化了,表面看或许是交互设计及相关设计的兴起,传统工业设计在一些情形上的隐退等这一些现象,但更深层的是整个设计的变化,不只是一个领域的设计替代另一个领域的设计,工业设计同样也发生了变化,如果说有机会参与到这个变化中的

java-Java中PDF转图片报运行时异常,错误看不懂,求帮助

问题描述 Java中PDF转图片报运行时异常,错误看不懂,求帮助 下图是控制台报错信息,求大神帮忙看看,是PDF格式不支持吗? 解决方案 看下是不是你的页面太多,内存不够,需要调整jvm设置.

tring format报错-在myEclipse9.0中运行String.format报错

问题描述 在myEclipse9.0中运行String.format报错 错误信息:The method format(String, Object[]) in the type String is not applicable for the arguments (String, String) 源代码: public void test1(){ String str=null; str=String.format("Hi, %s", "林计钦"); // 格式化

spring +springmvc+mybatis,service中调用dao接口报空

问题描述 spring +springmvc+mybatis,service中调用dao接口报空 搭建ssm,启动项目没问题,但是在service实现类中调用dao接口时,对象loginDao对象是空的,错误信息如下 log4j:ERROR Error occured while converting date. java.lang.NullPointerException at java.lang.System.arraycopy(Native Method) at java.lang.Abs

c++-在windows下mingw对类中含有模板函数报错

问题描述 在windows下mingw对类中含有模板函数报错 在windows下用mingw 进行编译报错,说解析模板参数列表报错.在linux下编译正确. 代码我已经简化: #include <iostream> using namespace std; class Point{ public: //实现setPoint函数 void setPoint(int x, int y){ xPos = x; yPos = y; } //实现printPoint函数 void printPoint(

ts码流-如何从未解压的TS码流中寻找到运动矢量?

问题描述 如何从未解压的TS码流中寻找到运动矢量? 本人课题研究内容:对 压缩编码(MPEG2 or H.264)后且未经解压 的TS流进行选择性加密.我把视频中的运动对象作为选择性加密的对象,通过从TS码流中寻找能够反映运动对象的信息继而加密来实现. 现在的思路:根据MPEG2标准文档给出的 TS码流语法结构 去定位运动矢量,即通过相关标识位.起始码等逐层(视频结构分层)寻找,但目前仍未找到. 不知道我的表述是否清楚,这个问题困扰我大半年,希望对这方面了解的朋友能够帮忙解答,时间要求较紧,拜托