ZestFinance:大数据征信应用与启示

近期,美国互联网金融公司ZestFinance受到国内互联网金融专业人士的热捧,其基于大数据的信用评估模型也越来越受到关注和效仿。本文结合美国的金融环境,对ZestFinance进行简要介绍,分析大数据征信产生的背景,剖析大数据征信技术,并全面客观地阐述了大数据征信技术对于中国互联网金融和征信业未来发展的借鉴意义。

ZestFinance简介

ZestFinance,原名ZestCash,是美国一家新兴的互联网金融公司,2009年9月成立于洛杉矶,由互联网巨头谷歌(Google)的前信息总监道格拉斯·梅瑞尔(Douglas Merrill)和金融机构Capital One的信贷部高级主管肖恩·卜德(Shawn Budde)(曾管理过收益超过10亿美元的次级信贷业务)联合创办。ZestFinance的研发团队主要由数学家和计算机科学家组成,前期的业务主要通过ZestCash平台提供放贷服务,后来专注于提供信用评估服务,旨在利用大数据技术重塑审贷过程,为难以获得传统金融服务(Underbanked)的个人创造可用的信用,降低他们的借贷成本。

ZestFinance起初是为传统的发薪日贷款(Payday Loans) 提供在线替代的产品。发薪日贷款因借款人承诺在发薪日还款而得名。由于美国传统的信用风险评估体系无法覆盖全部的人群,大约15%的人因没有信用评分而被银行排斥在外,无法获得基本的信贷需求。除了解决传统信用评估体系无法解决的无信用评分借贷问题,ZestFinance还主要面向传统信用评估解决不好的领域,将信用分数低而借贷成本高的人群视为服务对象,利用大数据技术降低他们的信贷成本。与传统信贷管理业务比较,ZestFinance的处理效率提高了将近90%,风险控制方面,ZestFinance的模型相比于传统信用评估模型性能提高了40%。

ZestFinance目前也正在向信用风险管理的其他领域纵深扩展,2014年2月ZestFinance宣布推出基于大数据分析的收债评分(Collection Score),旨在为汽车金融、学生贷款、医疗贷款提供一种新的评分系统。ZestFinance的未来发展方向是希望把其在这种发款日的贷款上的优势继续拓展到其他贷款领域,包括信用卡、汽车的贷款,甚至包括房屋的贷款,在未来的10~15年,这一方法将取代现行指标,成为申请信贷的唯一评估标准。

ZestFinance引起国内的关注始于2013年7月,当时全球第三方支付平台PayPal联合创始人、美国知名投资人彼得·泰尔(Peter Thiel)领投了ZestFinance的2000万美元融资。

为什么要进行大数据评估传统的信用评估服务无法覆盖全体人群,特别是弱势群体

图1展示了美国FICO评分与其对应的人口分布情况,初始每个人的分值基数为850分,信用评分模型利用征信数据从多个评分因素考察消费者的信用风险,从850分中减分。大致来看,美国个人消费者信用评分人群分布状况呈现两头小中间大的形态,信用分数处于750~850的人群有40%之多,其中信用分数在800~850大约占总人数的13%,在750~799超过总人数的25%,这是整个信用社会的中间阶层,对应于美国的中产阶级。其中,美国个人消费者的平均FICO评分为678。从图1可以看出,还有大量的人群远低于平均的678分,如FICO评分在550~549的占8%,在500~549的占5%,小于499分的占2%。根据FICO的标准,如果人们未能如期还款,或者缺乏借贷经历,他们就会自动被视为风险人士,他们的贷款也就会被惩罚性地给以更高的利率。还有一种可能,那就是他们的贷款申请会被拒,无论是否事出有因。比如,遇到了医疗紧急事故,或者最近刚刚移民美国。表1根据FICO评分将服务人群分为四个区间,并对应不同的金融服务机构。信用记录不完整或者不够完善的个人消费者,依据传统信用评估体系(FICO评分),往往很难被传统金融服务机构所覆盖,即使在金融体系发达的美国也无法获得常规的金融服务,或者需要付出很大的代价才能获得常规的金融服务。

传统信用评估模型信息维度比较单一

传统的FICO评分模型的基本思想是比较借款人信用历史资料与数据库中的全体借款人的信用习惯,检查借款人的发展趋势跟经常违约、随意透支,甚至申请破产等各种陷入财务困境的借款人的发展趋势是否相似。如图2所示,它主要从五个方面考察用户的信贷资质。但随着信贷业务的进一步开展,FICO信用评分由于单一的标准、严苛的门槛和片面的评估结果而饱受诟病。

传统的信用评估模型虽然在进行信用风险管理过程中发挥了很大的作用,如曾经促进了美国房贷市场的飞速发展。但在大数据背景下个人消费者出现许多信息维度,如电子商务、社交网络和搜索行为等,传统信用评估模型解决问题的能力越来越受限。

传统信用评估模型时间上比较滞后

虽然FICO评分仍然体现风险排序,但其预测绝对风险的能力和在2008年金融危机中的表现饱受指责,图3展示,FICO分数从2005年到2011年在美国人口中的分布基本上没有大的变化,这和2008年金融危机爆发之后出现大量坏账的现实严重不符。

由于传统的基于FICO评分的信用评估模型覆盖人群窄、信息维度单一、时间上滞后,所以,在大数据时代,需要探索信用评估的新思路。国外三大征信机构和FICO公司都已经开始了如何利用大数据技术来完善传统信用评估体系的前瞻性研究,如益百利(Experian)投入研究团队关注社交网络数据对信用评分的影响,FICO公司多年前就开始了在线评估的信息工具和基于互联网的信用评估系统的项目研究。

ZestFinance大数据信用评估的实践

ZestFinance的基本理念是认为一切数据都是和信用有关,在能够获取的数据中尽可能地挖掘信用信息。ZestFinance对大数据技术的应用主要从大数据采集和大数据分析两个层面为缺乏信用记录的人挖掘出信用。

大数据采集技术

ZestFinance以大数据技术为基础采集多源数据,一方面继承了传统征信体系的决策变量,重视深度挖掘授信对象的信贷历史。另一方面,将能够影响用户信贷水平的其他因素也考虑在内,如社交网络信息、用户申请信息等,从而实现了深度和广度的高度融合。

ZestFinance的数据来源十分丰富,依赖于结构化数据的同时也导入了大量的非结构化数据。另外,它还包括大量的非传统数据,如借款人的房租缴纳记录、典当行记录、网络数据信息等,甚至将借款人填写表格时使用大小写的习惯、在线提交申请之前是否阅读文字说明等极边缘的信息作为信用评价的考量因素。类似地,非常规数据是客观世界的传感器,反映了借款人真实的状态,是客户真实的社会网络的映射。只有充分考察借款人借款行为背后的线索及线索间的关联性,才能提供深度、有效的数据分析服务,降低贷款违约率。

如图4所示,ZestFinance的数据来源的多元化体现在:首先,对于ZestFinance进行信用评估最重要的数据还是通过购买或者交换来自于第三方的数据,既包含银行和信用卡数据,也包括法律记录、搬家次数等非传统数据。

再次是网络数据,如IP地址、浏览器版本甚至电脑的屏幕分辨率,这些数据可以挖掘出用户的位置信息、性格和行为特征,有利于评估信贷风险。此外社交网络数据也是大数据征信的重要数据源。

最后,直接询问用户。为了证明自己的还款能力,用户会有详细、准确回答的激励,另外用户还会提交相关的公共记录的凭证,如水电气账单、手机账单等。

多维度的征信大数据可以使得ZestFinance能够不完全依赖于传统的征信体系,对个人消费者从不同的角度进行描述和进一步深入地量化信用评估。

大数据分析模型

图5展示了ZestFinance的信用评估分析原理,融合多源信息,采用了先进机器学习的预测模型和集成学习的策略,进行大数据挖掘。首先,数千种来源于第三方(如电话账单和租赁历史等)和借贷者的原始数据将被输入系统。其次,寻找数据间的关联性并对数据进行转换。再次,在关联性的基础上将变量重新整合成较大的测量指标,每一种变量反映借款人的某一方面特点,如诈骗概率、长期和短期内的信用风险和偿还能力等。然后将这些较大的变量输入到不同的数据分析模型中去。最后,将每一个模型输出的结论按照模型投票的原则,形成最终的信用分数。

其中,ZestFinance开发了10个基于机器学习的分析模型,对每位信贷申请人的超过1万条数据信息进行分析,并得出超过7万个可对其行为做出测量的指标,在5秒钟内就能全部完成。这10个模型以如下的方式进行投票:让你最聪明的10个朋友坐在一张桌子旁,然后询问他们对某一件事情的意见。这种机制的决策性能远远好于业界的平均水平。

近年来,这种基于大数据的信用风险评估框架(远不能称为主流的信用评估方法)被国内外多家互联网金融机构采用,如德国的Kreditech、美国的Kabbage,以及国内最近获得IDG公司A首轮4000万元投资的闪银(Wecash)等,对传统的信用体系形成了冲击。

如表2所示,将这种将基于大数据技术的信用评估体系和传统信用评估(以美国的征信体系为例)相比,发现主要的区别有以下几个方面。

(1)从服务的人群来说,新的信用评估体系可以服务没有被传统征信体系覆盖的人群,即没有征信记录的人群(美国的征信体系能够覆盖85%的人群,覆盖不到15%的人群)。

(2)从数据源来说,这种新的信用风险评估体系大量采用非传统的信用数据,包括互联网上的行为数据和关系数据,传统的信用数据(银行信贷数据)的比重仅占到了40%,甚至完全不用传统的信贷信用数据进行风险评估。

(3)从关注的侧重点来看,传统的信用评估模型更关注授信对象的历史信息,致力于深度挖掘。而新的信用评估体系更看重用户现在的信息,致力于横向拓展。

(4)信用量化评估的方式也发生了改变,新的信用评估体系抛弃了只用很少变量的FICO信用评分模型,基于大数据技术,不仅采用机器学习的模型,而且使用更多变量,一方面可以使信用评估的决策效率提高,另一方面还明显降低了风险违约率。

对中国互联网金融和信用评估的启示

利用大数据技术的信用评估方法在现实中有着很大的市场需求,如国内快速发展的互联网金融中的风险管理问题。目前互联网金融处于快速的发展过程中,根据银监会的统计,目前国内可查的P2P网贷公司已经达到1200家。信用风险评估是P2P网贷的核心问题,存在很多挑战,如很多信贷客户没有或者是缺乏银行的信贷记录。在应对风险控制的挑战时,ZestFinance受到了互联网金融机构的热捧,目前国内多家互联网金融机构正在和ZestFinance洽谈合作,认为这种利用大数据技术的信用评估方法是解决国内互联网金融和普惠金融的信用风险管理问题的灵丹妙药。然而对于ZestFinance的大数据征信技术,还需要有全面的认识。

(1)ZestFinance的大数据征信是完善和更新传统征信系统的积极尝试,而不是替代品。美国的金融体系比较健全,而且信用体系也比较健全,这是ZestFinance赖以生存的土壤。ZestFinance的服务人群定位比较清晰,并且有完善的征信体系做支撑,ZestFinance并不是完全摆脱传统征信体系,在ZestFinance进行信用评估时,传统征信数据要占到至少30%。中国的金融生态环境和美国还是有一定的差别,ZestFinance的经验不能直接照抄照搬,需要进行消化吸收,结合中国的实际情况来进行大数据征信。另外,生活在互联网时代,面对大数据技术的发展,美国三大征信机构以及FICO也已经开始大数据征信方面的研发(作为常规的数据源更新的一种方式),但截至目前,尚未形成独立的信用评估手段。

(2)ZestFinance的体量不大,目前仅为10万美国人提供了服务,在美国的影响力有限,真实的效果目前还很难总体评价。截至2013年7月,ZestFinance的C轮融资达到2亿美元。

(3)ZestFinance的大数据分析模型也给信用风险管理带来复杂性的挑战。传统的基于FICO的信用评估方法,处理的变量比较少,对每一个变量进行细致地处理,并且可以给出合适的解释,模型的透明性可以方便地在银行的不同部门之间进行沟通,而且便于个人消费者对分数的理解。ZestFinance的基于大数据的数以千计的变量规模和多模型使得数据的处理和模型的解释变得比较复杂,在实际应用中会带来许多麻烦。

(4)大数据的应用要注意个人的隐私保护。ZestFinance在利用个人消费者的大数据进行信用评估时,很多数据会涉及个人隐私,如对于个人社交网络的数据(微信朋友圈)和电商交易的数据、通话记录、微博的数据等应用,美国对个人隐私的保护是有明确的边界的。而国内关于个人隐私方面的保护目前处于空白,已经出现国内一些互联网金融公司为了进行信用评估,忽视个人消费者的知情权和隐私保护。因此在利用大数据进行信用评估的时候,要考虑使用个人隐私的合规性前提。

虽然以ZestFinance为代表的新兴信用评估体系还不够成熟,但是为征信业的变革注入了活力,特别是对于中国的征信体系的建设会有一定的启示作用。

(1)普惠金融需要挖掘更多人的信用。国内目前真正发挥作用的征信体系主要是央行的征信系统,所覆盖的人群还是非常有限,远远低于美国征信体系对人口的85%的覆盖。目前我国个人有征信记录的仅有约3.2亿人,约占13.5亿人口中的23.7%。国内数量庞大没有被传统征信体系覆盖的人群同样也需要信用服务,享受金融普惠,这就需要探索征信的新思路。

(2)互联网上的海量信息可以成为征信体系的新数据源。ZestFinance的大数据实践的重要方面就是大量地利用互联网上的数据作为征信的数据源。中国目前是世界上互联网人口最大的国家,截至2013年12月,中国网民规模达6.18亿人,互联网普及率为45.8%,其中手机网民规模达5亿人,继续稳定增长。2013年中国网络购物用户规模达3.02亿人,网络使用率达到48.9%。截至2013年12月,我国使用网上支付的用户规模达到2.6亿人。这些海量而且丰富的互联网数据资源可以被国内征信体系建设很好地利用,通过分析互联网上这些信用主体的基本信息、交易行为信息和金融或经济关系信息,同样可以挖掘出这些信用主体的信用模式。

(3)大数据技术可以使得“一切数据皆信用”成为可能。以大数据为代表的IT新技术的应用,给征信体系建设带来了新的思路,原来海量庞杂、看似无用的数据,经过清洗、匹配、整合和挖掘,可以转换成信用数据,而且信用评估的效率和准确性也得到了一定程度的提升。新的信用风险体系的一个颠覆性的基本思想是一切数据皆信用,这是需要大数据技术来支撑的。国内征信体系的建设应当关注大数据技术的应用和发展,并加大投入,勇于实践。

原文发布时间为:2014-10-29

时间: 2024-09-27 16:22:31

ZestFinance:大数据征信应用与启示的相关文章

百度投资ZestFinance 完善大数据征信布局

7月18日,百度宣布战略投资美国金融科技公司ZestFinance,该公司的主营业务是将机器学习与大数据分析融合起来提供更加精准的信用评分.作为此次投资合作的部分内容,百度将引入ZestFinance核心技术,与自身技术和大数据相结合,提升其信用评估决策能力,完善大数据征信布局,将技术赋能金融业务又向前推进了一步. 如何对借款人实施有效的信用风险管控是互联网金融始终面对的一大难题.在目前的国内征信市场上,普遍存在信用评分系统分散化,过度依赖银行信贷数据的问题.而基于大数据分析的征信模式则不仅包括

通都不通也好意思叫大数据征信

中国现在是全球第二大经济强国,可征信系统的成熟度却不能匹配我们的经济地位.银行.互联网.机构都说自己是大数据征信,可彼此数据沟通不通顺怎么能叫大数据啊,这不都成数据孤岛了吗? 美国征信走过百年路 说到征信就不得不提美国,从19世纪末第一家征信机构诞生到现在,美国的征信历史已有上百年,到了1980年前后,美国三大个人征信巨头已经完成了美国成年人口的全覆盖.2009年Zest Finance公司成立,利用自身数据挖掘能力和模型开发能力,建立了分析模型,进行最终消费者信用评分.由此形成了传统三巨头纵向

大数据征信如何提升金融机构风控能力

近年来,互联网金融的迅猛发展,对线上线下金融机构的风险控制都带来了较大的挑战.一方面,以商业银行为代表的传统金融机构,其主流风控策略主要以央行征信报告为主要数据源,以专家经验或专家规则为评判策略.过于定性的风控方法,虽然降低了坏账率,但是不利于业务发展,容易错失很多有效客户:另一方面,许多新兴的互联网金融机构,由于所掌握的客户信息有限,风控经验的薄弱和风控执行手段不够专业,其逾期率和坏账率远超于银行. 好在随着移动互联网时代的来临,从电子商务到互联网金融,人们在网络上产生的数据"足迹"

大数据征信六大难题待解

随着消费金融.网络借贷等互联网消费模式快速增长,以及大数据技术突飞猛进,大数据征信服务机构开始大量涌现.但多元化.多层次征信市场体系建设面临一系列挑战,有很多难题尚未破解. 一是数据的质量.权威性问题.相比于央行征信系统的权威性.数据质量的高可靠性,大数据征信机构虽然数据来源更加宽泛.品种更加丰富,但数据质量.权威性受到质疑.美国国家消费者法律中心2014年3月对主要的大数据征信公司进行调查后并发表了题为<大数据,个人信用评分的大失望>的调查报告,报告称,大数据征信公司的信息错误率高于50%.

大数据征信如何为一个人建立数据肖像?| 硬创公开课

"凡走过必留下痕迹",大数据时代,你的一举一动都在为你建立一个电子档案,从你有多少张信用卡.每个月消费多少.还款记录如何到你喜欢浏览什么网站.手机是什么型号甚至IP地址对应的位置,有一万多个词条可以刻画你的肖像,银行在不需要跟你打交道的情况下可以靠这种数据肖像决定要不要给你放款.放多少合适.这就是大数据征信. 每个人每天会产生无数的信息,征信机构如何从这里面抽丝剥茧找到有效的数据,又如何给每个数据设置合理的权重去建立模型?机器出现故障之后又如何修正?我们请到了在征信上有多年经验的嘉宾.

大数据征信成撬动消费金融的支点?

文章讲的是大数据征信成撬动消费金融的支点, [IT168资讯]如果要说近日整个互联网金融领域什么最火,相信必然非消费金融莫属.但是消费金融更多建立的是一种信用消费,而这个核心和根本就在于个人征信.但是看看目前国内整体的互联网金融个人征信,却仍然存在许多不足之处. 1.目前整个国内的央行征信系统虽然覆盖到了8亿人,但是真正和银行有信贷关系的只有3亿人.尤其是央行的征信目前尚没有介入到任何非银行类机构,客户的信用分析也不能仅仅依靠央行的征信报告就能够完全判断准确.对于大部分的传统机构来说,他们掌握的

大数据征信:央行开了“半扇门”

在1月5日,中国人民银行官网发布消息称,人民银行已印发<关于做好个人征信业务准备工作的通知>,要求芝麻信用管理有限公司等八家机构做好个人征信业务的准备工作,准备时间为六个月. 这是2013年3月15日中国征信领域首部法规<征信业管理条例>开始施行之后,央行第一次通知企业做个人征信的准备工作,多位受访专家认为,这无疑在征信市场化方面向前推进了一步.中国企业在征信业的探索始于上世纪90年代初,由于国内征信行业此前一直没有专门法规,其运行一直处于灰色地带. 这同时意味着,今后中国人个人信

什么才是真正的大数据征信?

随着国家推动社会信用体系建设的步伐不断加快,大数据征信的概念得到广泛传播,已被越来越多的公众所认知.大数据征信代表着未来征信业的发展方向,将深刻改变商业交易模式,成为支撑市场经济健康快速发展的基础性产业. 大数据征信前景广阔,在资本市场.商务合作和终端消费市场,征信产品的需求已经显现出来,金融机构.企业和消费者对通过第三方大数据征信机构在经济活动中考察合作和交易对方的信用状况抱有很大的期待. 目前国内注册成立的征信机构无一例外将发展目标锁定在了大数据征信上.大数据征信首要的工作就是信用信息数据库

【干货】史蕾:大数据征信时代的个人信息保护

嘉宾介绍: 史蕾:1998年毕业于复旦大学国际经济法专业,现柏杨云天(北京)企业咨询有限公司,合伙人.曾就职于纳斯达克B2B上市公司环球资源(NDSDAQ:GSOL)和奇虎360法务部. 密切关注大数据企业和大数据产品的创新性业务实践,为多家大数据公司产品合规分析.用户协议拟定.个人数据保护和隐私政策的制定.股权激励项目提供专项咨询意见. 讲座全文: 各位嘉宾下午好,首先感谢韩院长和清华大数据研究中心给我提供这次机会,也感谢微路演梁总的推荐.今天下午我带来的题目是<大数据征信时代的个人信息保护>