宜信大数据负责人Joyce:当金融遇上大数据,能擦出什么火花

ZDNet至顶网软件频道消息: 这两年,互联网金融的成长速度让一些不可一世的传统金融巨人也不禁打了个冷战。倒不是因为互联网金融业务的规模真的威胁到了传统金融,而是伴随它而来的这股创新力量让传统金融行业中存在的问题和局限性暴露无余。所幸,已经有一些人开始意识到问题的紧迫性,当然,还有问题背后所蕴藏的巨大机遇。

Joyce Zhang 就是这些人中的一个。Joyce 是宜信 CEO 唐宁从美国挖来的一位资深大数据专家,现在担任宜信大数据创新中心的总经理。在来宜信之前,Joyce 曾经服务过 Hulu、Microsoft 等公司,主要负责的是基于大数据的推荐引擎、搜索平台、广告精准投放等技术系统的开发。Joyce 说:“一直想做些跨界的事情,而金融与大数据结合后会有很多可能性,这些可能性让我充满期待。”

问题出在哪儿?

目前,互联网金融的体量还非常小。以 P2P 网贷业务为代表,截至 11 月其规模为 2450 亿,而传统金融行业拥有的资产却是百万亿的量级。虽然在规模上的冲击几乎可以忽略不计,但这几千亿的背后却是传统金融不曾服务到的那些小微人群。当金融开始走向普惠,问题也随之暴露出来。金融的本质在于通过风险管理实现资本价值,可传统金融的征信手法却不能完全满足互联网金融业务的风控需求,这既包括覆盖人群的局限,也包括风控手段上的局限。我国缺失多年的社会信用体系正在加速现形。来看看下面几点:

1、在央行有征信记录的人不足全国人口 1/4

按照央行最新数据,目前央行征信系统中共有 8.4 亿人,但其中有实际征信记录的只有 3.2 亿人。也就是说,全国 13 亿多人口,有 5 亿人在征信系统中只是一个身份证号码,还有 5 亿人完全不在系统内。有征信记录的人只占到全国人口数的 23.7%,远低于美国征信体系对人口的 85% 的覆盖率。而在 P2P 蜂起之前,很多人并没有注意到这件事。

2、央行征信中心的数据不是你想用就能用

目前,可以接入央行征信中心的金融机构有银行、持牌照的第三方征信服务商以及部分地区的小贷公司(第一批于 6 月在上海获批),P2P 平台尚没有接入资格。这无疑将加大 P2P 平台的风控难度。不仅如此,P2P 平台上的贷款人信息也不能被录入央行征信系统,各家 P2P 成了一个个信息孤岛,他们手中信用数据的价值也得不到充分开发。

3、传统征信手段存在诸多局限

在数据范畴上,传统征信数据来自于借贷领域,最典型的就是信用卡消费记录,这就大大限制了征信数据的来源。 在征信思路上,传统征信是用昨天的信用记录来判断今天的信用价值,这未见得就是最合理的思路。在征信技术上,传统的方法是从线下采集信用数据,即使在 P2P 网贷业务中,也只能暂时照搬这套方法。

来看看目前国内 P2P 平台的征信逻辑:先考虑用户的数据拼图里需要哪些资料,能够电子化获取的就电子化,不能做到的,就让用户自主上传,然后通过其他线上或线下手段验证。目前,以有利、积木盒子等为代表的与线下小贷公司或担保公司合作的 P2B 网贷平台更多是通过合作的小贷公司或担保公司来获取借贷人的征信数据,主要是电话征信和实地考察征信,这都是传统金融机构的风控方式,效率比较低。当然,也有积极践行线上征信的 P2P 平台,比如宜人贷、拍拍贷。可以说,传统的线下征信技术限制了数据来源和信用评估思路,而互联网的技术、工具和思维具备了改变这一切的可能性。

其实,信用数据不仅仅是应用在金融领域中,生活中各种涉及履约的场景都需要人们的信用数据。在一个成熟的信用社会中,人们的每一项商业行为都应与他的信用数据相挂钩,从而形成一个信用数据的良性循环。也正因为如此,很多在美国做的风生水起的商业模式搬到中国来却无法成功,比如各种短租业务,其核心问题之一就是国内缺乏一套完善的信用评估体系。

宜信“大数据金融”的玩法

当金融遇上大数据,这个缺失已久的信用体系有了搭建的可能性,这也是唐宁成立宜信大数据中心的初衷。Joyce 将宜信在大数据金融上的探索方向描述为“金融云平台”。

顾名思义,这会是一个开放的平台架构:既能支撑宜信自己的 P2P 业务(比如宜人贷、与 eBay 合作的商通贷),也能开放给其他生态合作伙伴,让这个生态中的伙伴们共同建设、共同受益。

  • 金融知识图谱是平台的基础

金融云平台拥有一般云平台的特点:分布式存储、分布式计算框架、虚拟化环境,但与一般的云平台的差别在于,这是一个基于金融业务的云平台,其中必然包含特定的业务逻辑。宜信将风控、反欺诈、获客能力等核心的金融逻辑抽象出来,作为金融云平台的内核。

金融知识图谱是平台的基础,在这个基础上能长出很多应用场景,比如获客、实时授信、产品个性化推荐、贷后管理等

知识图谱这个概念最早是由 Google 提出的,是搜索引擎往下一阶段演进的过程中发展出来的。这其中包含两个方面:实体的画像,实体间的关系

实体的画像其实就是我们常说的“用户画像”,很好理解。而实体间的关系是 Joyce 特别强调的一点。原来做用户画像时,画像之间是彼此独立的,但这并不符合现实生活中的场景:人并不是独立存在的,人与环境中的万物都是有关联的。如果说每个人是知识图谱中的节点,那么人与环境所形成的关系就是两点间的线。当把“点和线”综合起来分析时,我们对个人的性格特征、信用状况、财富属性都会有更深层、更全面的理解。

  • 丰富的数据来源是平台的养分

互联网技术和工具的引入使得数据采集从线下逐渐转移到了线上,也使得数据体量迅速变大。目前,宜信金融云平台所采集的数据主要是以下几类:

1、宜信已有的数据

宜信在 P2P 行业有 8 年积累,用户已过百万。实际上,只要与宜信有过接触的用户,不管是在哪个环节终止了接触,都被视为宜信的重要数据资产。他们有的曾提交过信用报告、联系人信息、教育水平、工资单、银行流水等一系列传统征信数据,有的则仅仅留下了一些搜索和访问数据。

值得庆幸的是,宜信自成立以来便非常重视数据的电子化,因此大大减轻了将线下数据进行数字化的工作量。不过,宜信业务线众多,Joyce 告诉我们,将不同业务线里沉淀下来的数据打通也是一件很费劲的事情。

2、搜索引擎抓取

Zest Finance 的 CEO Merill 认为,信贷记录属于强变量,而当强变量缺失的时候,就可以参考多种弱变量(比如互联网上的行为数据),将这些弱变量组合起来也可以服务于信用评估。

同样是基于这种思路,宜信自己做了一个叫做“宜搜”的搜索引擎。在获得用户授权许可的情况下,搜索引擎会抓取用户在互联网上留下的电商购买数据、搜索引擎数据、社交数据等多个维度的数据。除此之外,还有大量散落在网上的公开数据,这些数据也会被宜搜所抓取。这两类数据将通过特定的算法模型转化为信用评估数据。

3、来自合作伙伴的数据

这里的合作伙伴既包括线上的也包括线下的,不过 Joyce 并没有透露现在正在参与合作的公司有哪些。我猜测,线下的合作机构可能包括小贷公司、租车公司、房屋中介等可能产生业务协同的机构,线上的合作对象则有更多可能性了,比如各种互联网金融服务商。

有一个绕不开的问题,那就是如何保证数据的真实性,其实这是所有的大数据分析都会遇到的问题。其实,任何人也无法保证数据完全真实、没有噪音,可以做的就是对不同的数据源进行关联和交叉验证。Joyce 说:“我们并不是在盲目的追求线上实时授信,如果没有足够的数据来做交叉验证,我们还是会采取线上线下相结合的方式。”

  • 机器学习是平台的核心

采集数据的目的是通过相应的数据分析和挖掘技术输出每个人的信用评估结果。在传统的数据处理领域,分析师们处理的主要是结构化数据,而如今我们面对的是从网上抓取的大量非结构化数据,如社交网络的评论、用户上传的音视频等。这些数据存在于包括文本、图片、视频、音频等众多的数据格式中,其中蕴藏的信息需要深度计算才可以分析出来。这就需要通过机器学习进行智能化分析。

根据过往的业务经验,Joyce 团队会给这个“挖掘机系统”预设一些规则引擎(可以理解为一些基础的算法),引导系统做出一些基本的判断和决策。比如,没有收入的人会被直接排除在借款人群之外。

但是,这都是些基础规则,而且是基于现有数据和经验生成的。一旦充入大量新数据,这些既有规则引擎则会发生变化。无论是修订现有规则还是获得新的规则,都需要通过机器学习来实现。

当然,机器学习是一个动态的过程——要通过不断加大数据变量来修正机器学习的模型。只要池子里变量的维度多到一定程度,模型就会趋于稳定。举个例子,如果你买一支股票,你的收入就全都取决于这只股票的涨跌;但如果你分散投资 1000 支股票,从统计学角度,即使其中一只股票暴跌,也不会对你的整体资产走势产生影响。只要数学逻辑正确,采用的变量越多,模型就越准确。而且,数据维度的不断丰富也能让机器在不断学习的过程中变得越来越智能。

宜信的第一批机器是在今年 4 月上线的,里面正跑着数以万计的变量。未来,收集和整理数据的门槛会降低,而利用机器学习进行数据分析和挖掘的能力会成为关键。

数据的价值

人人有信用,信用有价值。大数据能改变的不仅是金融行业。在一个真正市场化的社会中,各行各业都对个人信用评估有诉求,因此,基于大数据的个人信用评估结果可以成为很多商业活动的基础。如今,通过将用户的互联网行为数据转化为 “互联网信用”后,这些数据也开始变得有价值起来。

  • 数据定价

既然数据都是有价值的,那么是否可以给数据定价?“应该理解为价值交换”,Joyce 更正了我的说法,“数据的价值刚刚被唤醒,现在谈定价、收费还为时过早。”

目前,宜信已经与一些线下机构和线上互联网服务商建立了数据合作关系,但各家的合作方式都不太一样。尤其是对于不同行业来说,服务提供商的诉求差异巨大。Joyce 说:“我们也希望与不同合作伙伴来探讨适合彼此的价值交换方式。经过一段时间的合作,我们会逐渐建立一套针对不同数据提供商的价值交换模型和方法论。”

  • 数据变现

Joyce 好几次都提到了“数据变现”的概念。互联网行业里有很多这样的服务提供商:他们有用户、有流量、有数据,但却找不到自己的商业模式。又或者,即使有自己的商业模式,很多服务提供商手中的数据也远没有发挥什么作用。“数据变现”为他们提供了一个通过数据完成价值增值的思路。举两个例子:

  • 为商家提供额外的变现渠道。以宜信与 eBay 合作的“商通贷”为例:eBay 可以专注的做自己的电商生意,而如果 eBay 上的用户或商家有分期或者融资的需求时,eBay 只需开通相应的频道,并把用户数据授权给宜信进行处理,宜信来完成用户信用的评估并完成分期产品推荐、贷款实时授信等。
  • 帮商家提高用户转化率。中国有很多租赁场景都是需要交押金的,而交押金往往会影响平台的转化率。因此,宜信在与各种租赁公司尝试一种合作:租赁公司把用户的信息给宜信,宜信再结合自己抓取的一部分数据对用户进行信用评估,给出一个“信用价值”,从而免去用户的押金,并扮演平台的担保方,甚至能提供租后管理服务。

不是竞争对手,是盟友

国内想通过大数据做开放金融云平台的不止宜信一家,别忘了最有名的那家——蚂蚁金服。在蚂蚁金服的成立活动上,其 CFO 井贤栋曾说过:“蚂蚁金服将以小微企业和普通消费者为主要用户,建立以数据、技术、交易这三个开放平台为核心的金融生态,支持和帮助合作伙伴,共同为用户创造价值。”

这和宜信的愿景不谋而合,不过,在 Joyce 看来,谈彼此间的竞争还为时过早。在国内,通过大数据搭建信用体系这件事还处于非常早期的探索阶段,大家各自有优势,但还没有谁已经走通了这条路。“如果未来有可能,我们非常乐意与蚂蚁金服合作。”

其实,除了宜信、阿里这样打算做“生态系统”的平台,大数据金融场内的玩家还有不少。比如各种尚未走到生态系统层面的第三方大数据平台,举几个例子:国内最早提出做大数据征信的闪银(类似 Zest Finance)、从 SaaS 系统切入数据服务领域的中科柏诚、为线下 P2P 公司提供大数据服务的数信网。另外,还有一些在利用大数据支撑自身互联网金融业务的公司,比如拍拍贷(类似 Lending Club)、元宝铺(类似 Kabbage)。

但是,所有机构手中的数据都是片面的数据,尤其是对于 BAT 这样的巨头来说。这也是为什么,在 Joyce 看来,平台间的合作远比盲目的竞争更有利于行业的成长。“这个市场非常大,完全可以容纳多个开放平台同时存在。如果有更多的人愿意踏踏实实的做金融开放平台,这对行业、乃至整个小微人群是非常有益的。”

即使是在未来的金融生态中,合作也应该大于竞争。“生态系统” 本身便是一种商业模式。金融业的生态系统长什么样?它将以云计算、大数据为底层,信用体系为基础,支撑包括支付、投融资、理财、保险、银行等在内的多种业务。

“在美国,信用是一张个人通行证。而对于中国来说,这是我们走向一个真正市场化的商业社会的过程中必然会达到的阶段。未来,我们会有多个信用评估机构,每个机构都有自己的一套信用评估体系,而大家对信用的认识能够嵌入到各行各业的商业活动中。”

这大概就是在国外大数据领域钻研了 15 年后却带着团队义无反顾回到国内的 Joyce 想看到的一天吧。

原文发布时间为:2014年12月15日

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-10-04 00:33:38

宜信大数据负责人Joyce:当金融遇上大数据,能擦出什么火花的相关文章

宜信大数据负责人Joyce:当金融遇上大数据

这两年,互联网金融的成长速度让一些不可一世的传统金融巨人也不禁打了个冷战.倒不是因为互联网金融业务的规模真的威胁到了传统金融,而是伴随它而来的这股创新力量让传统金融行业中存在的问题和局限性暴露无遗.所幸,已经有一些人开始意识到问题的紧迫性,当然,还有问题背后所蕴藏的巨大机遇. Joyce Zhang 就是这些人中的一个.Joyce 是宜信 CEO 唐宁从美国挖来的一位资深大数据专家,现在担任宜信大数据创新中心的总经理.在来宜信之前,Joyce 曾经服务过 Hulu.Microsoft 等公司,主

当人工智能遇上大数据 第九届中国云计算大会——大数据与人工智能应用论坛吸睛亮点集结

至顶网个人商用频道 06月10日 北京消息(文/黄雅琦)科技正在进入一个新的时代,这个时代的一个典型特征就是数据成为一种宝贵的资产.在海量的数据支撑之下科技越来越智能,不仅能"听懂"我们的语言,还能"看懂"我们的表情,帮我们做出更为科学的决策.在这些科技进步的背后离不开数据处理技术的飞速发展,从商业智能.大数据到人工智能,人类对数据的处理能力不断提升,数据背后的商业价值在不断发掘,也给人类更大的帮助. 基于这样背景,第九届中国云计算大会将在6月14日-16日在北京国

叶炜晨:视频遇上大数据,会擦出什么火花

文章讲的是叶炜晨:视频遇上大数据,会擦出什么火花,在近期的视频网站大会上,除了"独播"这种老生常谈的话题,大数据名副其实当选为视频网站宣传时最爱的词,爱奇艺也不例外.早在2013年,爱奇艺就着手将大数据"落地",并研发了一套实时数据采集计算的综合解决方案-Venus.实时数据采集对视频行业到底意味着什么?当视频遇上大数据到底会擦出什么样的火花?这些谜题都会由本期采访嘉宾--叶炜晨,一一揭晓. ▲叶炜晨 叶炜晨,毕业于上海交通大学计算机系.2013年加入爱奇艺云平台,

当DCIM遇上大数据:ZNV中兴力维“维统管”驱动IDC产业

中国数据中心市场在规模不断扩大的同时,正由野蛮生长迈向精耕细作,对运维管理的重视度与日俱增.另一方面,传统行业的数字化转型.物联网在工业领域的应用将带来远超以往的数据量,这也对数据中心的运维管理提出了更高的要求. ZNV中兴力维4月下旬发布了最新一版的智慧数据中心综合管理系统--维统管2.1.与传统数据中心基础设施管理系统(DCIM)相比,其最主要差别就在于创新性地引入大数据技术,以此来打破数据库桎梏.支持秒级的高密度数据采集,带来更高效.更精准.更实时的管理,数据中心业主及运营者亦能藉此延展出

“大数据”+“工匠精神”擦出啥火花?

大数据等新一代互联网技术深刻改变了世界,也让各国站在科技革命的同一起跑线上.中国曾屡次与世界科技革命失之交臂,今天要把握这一历史机遇,抢占先机,赢得未来.(人民网) 当一个个简单直观的数据字码以无穷可能的形式组合在任何时空范围内进入互联网,就形成了大数据.事实上,大数据一直存在,只是互联网技术的到来彻底连接并激活了它,使得原本杂乱无有错必纠.错综复杂.千头万绪.纷繁无穷的大数据得以通过高性能计算机进行有目的.有针对性.有价值的科学分析,从而为科学.社会.经济态势.军事情报等各方面的理论研究和战略

世纪佳缘:当爱情遇上“大数据”

一年时间,大数据已开始进入人们生活的方方面面,恋爱也不例外. 据相关统计,有约五分之一的恋爱关系是从http://www.aliyun.com/zixun/aggregation/17676.html">婚恋网站开始的.去年11月新华社报道,中国适婚单身男女数量已超过1.8亿,这一群"嗷嗷待哺"的单身青年在努力寻找一个方式,遇见爱情,婚恋网站成了他们最好的选择. 是什么在网络婚恋的背后默默无闻?庞大的数据库如何变身红娘,面对1.8亿单身男女的"饥渴"

十大编程算法助程序员走上大神之路

十大编程算法助程序员走上大神之路 算法一:快速排序算法 快速排序是由东尼·霍尔所发展的一种排序算法.在平均状况下,排序 n 个项目要Ο(n log n)次比较.在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见.事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来. 快速排序使用分治法(Divide and conquer)策略来把一个串行(list)分为两个子串行(sub-lists). 算法步骤:

CIO时代学院院长姚乐:传统行业遇上大数据 拥抱智能化未来

近几年,互联网行业发展突飞猛进,"大数据"技术瞬间变得炙手可热,当然,对于发展中的大数据技术而言,很多行业都不会错失良机.近日,CIO时代学院院长.中国新一代IT产业推进联盟秘书长姚乐在"2016CIO时代中国行深圳站"活动上发表了题为<大数据的行业应用策略>的主题演讲,详述大数据时代下行业的应用策略.   一.大数据之发展趋势   大数据的发展趋势已成为时下热议的话题,他指出了未来大数据技术与以下三个方面的融合是值得我们重视的.   1.区块链   如

一场不期而遇的美好 当无线遇上大数据

大数据是这个时代最伟大的机遇之一,其应用已经渗透到我们的各行各业和生产生活中.而无线网络为人们提供了高速上网体验,极大地丰富了我们的生活.当两者不期而遇,又会邂逅到怎样的美好"情缘"? "有了大数据,我们能做的更多更好!"如此自信之语来自新华三集团. 新华三是国内新IT解决方案领导者,尤其在无线网络建设方面积累有丰富的经验.过去,新华三一直专注于信息技术变革,聚焦在如何让无线设备更快.更稳定.更可靠,也就是"T"上:而现在,新华三力争实现经验价值