“大数据风控”方兴未艾,最终需要的还是硬技术

如今的“大数据风控”这一词,或许就如五年前的“引力波”、一年前的“青蒿素”一样,尚处于一个初生试水、萌芽之姿的阶段,机遇与挑战并存。不可否认地存在鱼龙混杂、乱象丛生的问题,”挂羊头卖狗肉”有名无实的事例也有,对于一些没有核心数据却吹嘘数据风控的大忽悠平台我们当然要擦亮火眼金睛。

做大数据风控本要求的是硬技术,谁能真正掌握谁才能扎根发展,行业内已经出现了一些有益的探索,显示了用大数据做风控的优势。

大数据

目前市场的大数据风控系统现状是:大公司通过大数据挖掘,自建信用评级系统;小公司通过信息分享,借助第三方获得信用评级咨询服务。

已有的风控大致分为两种模式,一种是类似于阿里的风控模式,他们通过自身系统大量的电商交易以及支付信息数据建立了封闭系统的信用评级和风控模型;另外一种则是众多中小互联网金融公司通过贡献数据给一个中间征信机构,再分享征信信息。

那么,哪些数据才是风控所需的呢?

1、电商大数据

电商平台能够累积大量的交易信息,可作为信用评级参考的原材料。

阿里金融是利用电商大数据进行风控的领头羊,在很多行业人士还在云里雾里的时候,阿里已经建立了相对完善的大数据挖掘系统。通过阿里巴巴、淘宝、天猫、支付宝等积累的大量交易支付数据作为最基本的数据原料,再加上卖家提供的销售数据、银行流水、水电缴纳等情况作为辅助数据原料。所有信息汇总后,将数值输入网络行为评分模型,进行信用评级。

2、 信贷记录大数据

小贷类网站积累的信贷大数据包括信贷额度、违约记录等等。但单一企业缺陷在于数据的数量级别低和地域性太强。还有部分小贷网站平台通过线下采集数据转移到线上的方式来完善信用数据。这些特点决定了如果单兵作战他们必定付出巨大成本。因此,贡献数据、共享数据的模式正逐步被认可,抱团取暖胜过单打独斗。

3、社交网站大数据

社交大数据是风控大数据的一个重要组成部分。通过社交人际网络关系数据和生活圈中其他如水电煤缴费信息、信用卡还款信息、支付和交易信息等,可以多方面地反映出用户的习惯偏好、价值取向、人际交往、信誉度和活跃度等信息。

利用社交网站大数据进行网络借贷风控的典型是美国的Lending Club。Lending club于2007年在facebook上开张,通过在上面镶嵌的一款应用搭建借贷双方平台,利用社交网络关系数据和朋友之间的相互信任聚合人气。借款人被分为若干信用等级,但是却不必公布自己的信用历史。

4、信用卡借记类数据

信用卡类网站的大数据同样对互联网金融的风险控制非常有价值。申请信用卡的年份、是否通过、授信额度、卡片种类;信用卡还款数额、对优惠信息的关注等都可以作为信用评级的参考数据。

5、消费数据

第三方支付类平台做风控的机遇在于,能基于用户的消费数据做信用分析。支付的方向、每月支付的额度、购买产品品牌都可以作为信用评级的重要参考数据。

6、生活服务类数据

生活服务类网站的大数据如水、电、煤气、有线电视、电话、网络费、物业费交纳平台则客观真实地反映了个人的基本信息,是信用评级中一类重要的数据类型。

大数据的海量也就意味着,对数据的理解和对有效数据的挑选非常重要,并非所有数据都是风控有用信息。要选取哪些数据原料进行挖掘,什么数据才是金融风控真正所需的,对数据的类型和实效性都要有所考量。

17年前,很多人认为互联网是泡沫,现在证明互联网没被高估;7年前,很多人认为电子商务是泡沫,但今天中国已经有几亿人的电商市场。

如今,大数据风控方兴未艾,也伴随着一些泡沫,但只要它朝着健康的方向发展,未来已来。大数据的相关理论与分析方法,很好地弥补了数据获得的时间连续性、数据的地理位置分布、数据样本的覆盖程度等传统分析方法中的不足,其精准度更高、覆盖面更广和响应速度更快的特点,运用到风险防控中大有裨益。大数据风控本身并非是忽悠,是真的具有发展的潜力,只是其研究还更待成熟。

最后借助苏萌教授在进行大数据辩论时的一句总结:所有新鲜事物都需要一定的泡沫,才能吸引到更多的投资和关注,最终才能让真正好的东西沉淀下来。

本文转自d1net(转载)

时间: 2024-11-04 01:39:36

“大数据风控”方兴未艾,最终需要的还是硬技术的相关文章

大数据风控的现状、问题及优化路径

在互联网技术和信息技术的推动下,大数据在金融行业的风控中获得了引人注目的进展,但是在实际运用中其有效性还需进一步提高.当前大数据风控有效性不足既有数据质量的障碍,也有大数据风控的理论性障碍,还有数据保护的制度障碍.消除这些障碍.提高大数据风控的有效性,需要金融企业.金融研究部门和政府监管部门的共同努力. 大数据已经撼动了世界的方方面面,从商业科技到医疗.政府.教育.经济.人文以及社会其他各个领域.早在1980年,阿尔文 托夫勒(Alvin Toffler,1980)在<第三次浪潮>一书中就预言

电商社交数据在大数据风控的应用实践

随着普惠金融业务的深入,以及消费金融业务竞争的白热化,针对信用白户的风控显得尤为重要.如何面向信用白户进行快速有效的信用评级,卧龙大数据根据自己的实践经验,就电商.社交数据在风控上的应用价值与大家进行一些分享. 电商社交数据的数据覆盖度 卧龙和众多不同类型金融机构进行了数据匹配测试,下图为各类金融机构的互联网行为数据整体匹配情况. 可以看出: 传统的农商行主要面对线下人群,线上数据的匹配率很低,要利用电商社交数据做信用评估基本不可行,利用大数据引流获客倒是一个值得关注的方向; 对于大型股份制银行

传统企业互+大数据风控经验分享

王虎:大家好!首先感谢能够给我这次机会,能够介绍我们大数据方面的经验,其实我们做这个东西,只是一年不到的时间,也是一个被迫做的,之前我们公司.先简单介绍一下我们公司吧,我们公司是一个专业的第三方支付公司,2007年成立,注册是1个亿,2012年拿到牌照,2015年是拿到跨境支付的牌照,我们主要是做第三方支付.在三方支付的过程当中,我们遇到了各种各样的风险,之前我们都是靠手工去做,因为我之前是在做智付店里面做风控总监,一直是在做风控这一块,我们在风控当中遇到的一些困难,我们也是无法解决的. 首先一

如何设计基于Hadoop、Spark、Storm的大数据风控架构?

量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品"信用钱包"帮助个人用户展示经济财务等状况,撮合金融机构为用户提供最优质的贷款服务.金融的本质是风险和流动性,但是目前中国对于个人方面的征信行业发展落后于欧美国家,个人消费金融的需求没有得到很好的满足.按照央行最新数据,目前央行征信中心的数据覆盖人口达到8亿人[1],但其中有实际征信记录的只有3亿人左右,有5亿人在征信系统中只是一个身份证号码.此外,我国还有5亿人跟银行从来没有信贷交易关系,这5亿人对金融部门来

大数据风控指标----查准率与查全率

大数据风控指标介绍 2016-03-24 大林 1查准率与查全率 先说个例子,申请人有400个,其中有160个是好人,240个是坏人.我们用一个模型A,挑出了100个好人,其中真正的好人是80个,剩下20个是漏网之鱼. 我们定义一个"查准率"(precision),为挑出来的好人中,真正是好人的比例.即:  同时,我们定义一个"查全率"(recall),为查出来的好人占总的好人的比例.即: "查准率"和"查全率"是一对矛盾的概

网商银行俞胜法:大数据风控+平台化打造普惠金融能力

7月31日,在2016上海新金融年会暨互联网金融外滩峰会上,网商银行行长俞胜法表示,普惠金融不仅是一种愿景,还是一种能力,互联网金融.互联网银行想要去具备普惠金融的能力,需要从自身的风控能力,尤其是大数据风控加上合作平台 俞胜法介绍,网商银行开业一年多以来,服务了超过170万家小微企业,贷款余额达到230亿元,帮助千千万万的小微企业经营者.创业者去追逐他们的梦想,同时拉动了就业.支持了实体经济的发展. 利用大数据风控等技术优势,贴近电商经营解决小微经营者的融资难问题.众多的小微电商经营者缺少规范

后监管时代P2P生存路径:大数据风控能力是核心

争论P2P(下) 8月末,<网贷借贷信息中介机构业务活动管理暂行办法>落地,行业内各种声音此起彼伏,理不辩不明,9 月13 日,由21 世纪经济报道举办的"亚洲金融年会"之21新金融"P2P合规之路"闭门研讨会在京举行.来自监管.行业.法律.司法不同领域的人士,就新规给出了自己的真知灼见,行业的黎明已经到来,需要引导航向的灯塔. 导读 互金平台一位负责人表示,P2P的价值在于成为传统金融体系的补充,解决传统金融无法覆盖人群的金融服务."信息中介

数据智能,慧眼识“真”——个推大数据风控产品亮相

过去一两年,互联网金融迎来爆发式增长,其低成本.高效率.新模式的特点有效补充了传统金融机构的市场空白,承担着引导金融走向普惠的重任.与此同时,逾期率和坏账率高.欺诈申请较多等欺诈风险和信用风险也在日益攀升. 对互联网金融企业而言,传统风控手段成本过高.反馈结果慢,且覆盖率一般,而全场景风控产品误杀率又较高,都无法很好地满足风控需求,导致诸多互金机构面临着严峻的风控挑战. 近日,由联动优势主办的"第六届产品技术大会"在京召开.此次大会以"觉醒·Fintech"为主题,

想做大数据风控,先问问自己这几个问题!

大数据运用于互联网金融是近期一个异常火热的话题.不过细究起来,或许仍然概念性较强,不排除一些发展较好的平台,但从整体情况来看,大数据发展尚不成熟,还处于早期阶段. 想做大数据风控,先问问自己这几个问题! 大数据变现最好的状态是有数据源.能够进行数据挖掘.同时有用户的相关需求. 明略数据金融事业部解决方案专家杨昀举例表示,就像开采油田,基础是具有油田资源,核心是勘测开采需要的设备,加之用户资源需求,这才是一个行业应有的发展状态. 大数据运用于互联网金融是近期一个异常火热的话题.众多互联网金融平台动