在“2013中关村大数据日”的大数据互联网金融论坛上,天云大数据冯大志带来“大数据与金融创新”的主题演讲。
冯大志:大家下午好!非常高兴能有机会与大家探讨一下大数据对我们金融行业的帮助。我非常同意刘处长说的一句话,只有行业的大数据,而不是说我通过一个大数据去产生一个新的行业来。所以,我们看从天云这个角度来看的话,之前我们的产品发布大家也都理解,我们希望帮助企业共同成长,解决企业遇到的问题。
按照我们在做大数据的时候发现其实大数据从我们一个想法到我们怎么把它落地,面临着很多的问题。我在来到天云之前,做了6-7年的企业级仓库的建设,里面遇到了非常多的问题和挑战,我想今天从另外一个角度来讲,我们说大数据怎么能够既把它的平台优势发挥出来,帮助我们去解决一些问题,同时它的算法让成本优势怎么在金融中去体现出来,下面是我讲的一些主要的方式。
大数据包括现在互联网的一些发展,给我们带来的一个最大变化就是个性化,现在越来越强烈了。金融是一个传统的信息产业,我怎么能够从这个信息里面更好的为客户服务,这是我们前些年包括金融的一种信息化、互联网化,包括电子银行、网上支付发展这么长时间之后逐渐积累下来的,形成了这么多的效果。
现在互联网,尤其是移动互联不断发展的今天,我们发现在一定程度上金融门槛降低了,很多的企业当他有了一定的门槛之后,他可以在非常长的时间里面切下来一块。如果我们现在做一个特别简单的转帐交易,包含了转帐前、转帐中、你的交易、结算清算,包括转帐后会有很多的数据在产业链条中留下来。所以,我们在金融里面就讲另外一个东西,刚才刘处长也提到了,如何能够在这样一个大的链条里面快速的实现信息的融合,并反馈到每一个前端的交易甚至操作中,能够实现我们整个金融的快速反馈和构建。第三个挑战就是连接,我们为什么关注于移动互联网,为什么移动互联网的热度远远超过传统互联网,实际上人是一个有感情的,他是一个社会化的动物,他希望在任何时候、任何过程当中大家都联系在一起,能够满足他的情感需求。现在很多金融行业里面,包括保险公司也好,包括传统的金融行业,它在不断的建立自己跟客户之间沟通的管道,这种管道的建立更多是以手机APP形式存在。所以,从现在大数据的角度来看,当然大数据背后代表了很多的技术,我个人觉得我们金融行业未来的发展就是个性化和反馈。
大数据刚才讲了很多的方向和趋势,但是我觉得大数据对传统的金融行业来讲,其实是有两个特别重要的一个方向。当然,这里面我列了一个,其中这个叫分析的可扩展性,如果大家做传统的数据挖掘时一定深有体会,传统的挖掘怎么做?我们需要有非常多、非常好的博士,包括一些算法的工程师,我需要从传统的数据仓库里面去抽样一些数据来,去不断的优化算法,反馈到数据仓库里验证算法,所以整个算法的周期和准确度很大程度上依赖这些工程师的能力,而且依赖于你的抽样、采样数据到底多大程度上代表了你这个企业客户的贡献,这是传统的方式。
当你的数据分析从一百万拓展到一千万,有可能算法的复杂度会从一个简单的1到2的区别发生一个质的上升。这样的话,我们转而通过VI,通过一些统计分析,通过制定几百个围度的指标来衡量客户。但是大数据通过它的计算能力,这种分布式的计算能力能够在一定程度上实现非常多算法的分布式计算能力,就像我这里提到的,我们在给一个公司去做测算的时候,我们有3600万的存量客户,在我们的系统上大概20分钟跑完。但是传统的体系架构下,一千万客户已经很难做分析了,这样带给客户一个最大的好处是什么?我知道任何分析的结果就是一个事实,这个事实就可以直接用来指导对策,这就是大数据可扩展的分析能力带来的好处。另外一个,就是大数据对于传统数据的清洗、数据的质量转换、数据的治理,在很多层面,大数据可以做非常多的事情。对于传统的企业有什么好处呢?提升我们时间的处理效率。
这张图我们看到,我们通过一个非常简单的实验算法,在传统的分析里,需要对这个算法做实验,从这里面我们可以看到,进行一个简单的分析的话,我们就知道年收入大概在多少时大概对企业的贡献率是最好的,并不是年收入越高对企业的贡献就越大,而是年收入在2万多、4万多,有可能是二三线城市的普通员工,普通城市的市民可能更希望到我的这个保险公司来买保险。这些规定其实就是大数据通过一个算法能够发现出来一些规律,再把我们没有预先干预的规律反馈到我们实际的数据仓库作为一个指导。因为我知道这东西得出来的结果是一个事实存在的结果,并不是我通过算法预测出来的,也不是我通过很多的手段模拟出来的,而是实时存在的,所以它有快速的分析带来了一个非常快的反馈。
另外一块我刚才提到了,我们在整个金融行业里包含了两大类数据,第一类是金融业的内部数据。随着银行IT的建设不断完善,每一个业务在银行里面都已经做得非常精细了,而且也非常完善,但是这也带来另外一个问题,就是数据分布在企业的不同部门和不同角落里面,甚至有些数据存在,但是很多人都不知道这个数据就在那。这样的话就带来什么呢?如何在金融企业内部去实现数据的融合,去更大程度的发挥这个数据的价值,这一块在很多的企业里面,不管是金融,刚才刘处长也提到了,我们在广电行业也实现了的业务数据的融合,结构化和非结构化,这是我讲的内部数据的融合问题。
另外大数据还有一个好处是什么呢?它的这种数据库的数据存储模式更适合于把结构化、非结构化数据合在一起统一进行需求分析。刚才我们在下的时候,有一个客户跟我讨论,他特别关注的一个点就是如何把非结构化数据结构化,他为什么提这个观点呢?他认为现在企业里存在大量的非结构化数据,他需要对这些数据进行分析。我跟他说,非结构化数据的结构化,我们能提供一个算法能力和工具,真正如何把非结构化数据结构化,让它不失真、真实的反映企业的情况,这也是需要行业一起努力的,这也是我们在做大数据时希望合作方跟我们一起来做大这个产业,共同发展。
第三块,我觉得大数据在企业里最重要的特点就是品牌建设。我们现在做的比较多的是舆情方面的监控,包括品牌印象,这个品牌印象包含了比如说光大,我们谈到最多的理财,因为它是以理财为基础的吸引客户特别专业的一个银行。但是,同样是一个企业的全国的形象,在不同的省份里表现是不同的,你在西南边陲的一个重庆市,可能大家对光大的印象跟企业的宣传形象是完全不一样的,我怎么能够让一个总部的决策直接一竿子插到底插到基层,让每个人都知道在这个地区里面大家对你的印象是什么,大家对你竞争对手的印象是什么。所以,这样的话,我们需要用大数据,通过其他技术也好,我们能够去实现这种舆情方面的监控,把原来我们只是感觉到大家的一种感觉把它量化出来,这是大数据在金融里面另外一个应用的方式。
第三块是业务拓展,一个是完善,另外一个是引入。完善是如何能够去完善现有的体系,刚才雷总也提到了,现在我们信用评估体系已经很成形了,没有人能够去颠覆,破坏性创新这样一个体系,但是我们可以在此基础之上,通过客户的方式引入一个围度,能够把这个体系完善一点。还有一个思路是引入数据,什么叫引入数据?现在很多银行在做互联网金融,在做供应链金融,他为什么要做这个?因为他发现当你引入一个新的行业,它有产业上下游数据之后,你可以做更多的数据,可以精准的刻画一个人,更精准的去描述一个问题,或者说更好的看待一个趋势,这就是金融行业里面现在面临的很多问题,在这里面,大家他们谈到了很多的互联网金融、供应链金融,现在还谈到银行,其实本质在于如何合理的引入一个数据源,更好的解决我们未来银行体系的发展。
上面一块我们讲的是银行对于金融行业来讲如何更好的为我们的客户提供服务,这样的话,其实有非常多的方式,让我们既有了新的数据源,我们又能够知道在银行里面,在网上银行,每一笔操作能够通过分析更好的解决客户到底想要什么,他能够实现什么样的目的,他想买什么样的产品,包括刘处也谈到了跟很多企业在合作,其实就是想解决如何更好的为客户服务,金融竞争越来越厉害时,我觉得银行的形象不再是大而全的银行,而是专注某一个行业的银行。
下面我们谈到的一块是我们正在做一个尝试,能够把一些分散在互联网上的碎片化的零散信息捕捉到,而且能够把它量化出来,实现对企业价值的分析。这样的话,其实对于银行来讲,他有很多可控的可操作的负面控制,比如说金融危机来的时候,这个企业已经倒闭了,但是企业所有的信用状况在银行里是完好的。在金融危机爆发的时候,欧洲有一家银行就犯了一个低级错误,他的客户已经快倒闭了,但是他还贷给客户钱。我们希望在明年,我们的一些项目能够帮助一些企业去实现金融行业的落地。
以上就是我谈到的我们从天云角度,从我们算法的角度对金融创新的理解,非常感谢大家,谢谢!
(责任编辑:蒙遗善)