大数据风控指标----查准率与查全率

大数据风控指标介绍

2016-03-24 大林

1查准率与查全率

先说个例子,申请人有400个,其中有160个是好人,240个是坏人。我们用一个模型A,挑出了100个好人,其中真正的好人是80个,剩下20个是漏网之鱼。

我们定义一个“查准率”(precision),为挑出来的好人中,真正是好人的比例。即: 

同时,我们定义一个“查全率”(recall),为查出来的好人占总的好人的比例。即:

“查准率”和“查全率”是一对矛盾的概念。通俗来讲,要想“查准率”高,要把标准卡的严苛一些(模型的分数阈值取的高些,让绝大多数申请人都判断为坏人,只有极少数特别好的人判断为好人)。但同时,因为通过的人较少,占总的好人的比例必然降低。即,“查全率”会降低,更多的好人被误判为坏人了。

反过来,如果标准卡的松些,更多的好人被挑了出来,“查全率”提高了。但是,漏网之鱼也更多了,“查准率”自然会降低。

2查准率,查全率和通过率,坏账率的关系

“通过率”和“坏账率”是风险控制上的术语,而“查准率”和“查全率”是机器学习的专业数据。他们表达的意思是一致的,但具体的含义是不同的。

“坏账率”的意思是,判断为好人的群体中,真正的坏人所占的比例。即:

可见

即“坏账率”与“查准率”的和就是100%,两个指标只是从正反两个反面来考察同一个物理意义。

“通过率”为模型判断为好人的人数占总人数的比例,即

本例中,通过率为100/400=25%。

为什么业内很少用“查全率”,而用“通过率”这个概念呢?

这是因为,在真实的业务中,我们拒绝掉的那一部分申请中,有多少是好人,我们是不清楚的,所以“查全率”的概念,只能在模型训练的时候使用(训练的用例都是已知结果的)。而“通过率”则可以直接度量,简单易算。从物理意义上将,两者度量的目标是一致的。

3评价风控的指标是什么呢?

谈起一家金融公司的风控能力,外行往往只谈论“坏账率”这一个指标。这是不全面的。不过作为第三方,谁又关心它的“通过率”呢?尤其是以这样的资产理财的人,巴不得坏账率为零,自己遭受损失的风险是最小的。但从内控来讲,风控部门的人员,是希望“坏账率”降低的,这提现了他们的风控能力是很强的,并且他们的收入,往往也跟坏账是挂钩的。

但是,如果“坏账率”很小了,“通过率”也很小,金融公司均摊到单个成交客户上的运作成本就很高。在真实的业务中,获取客户和审核客户都是有很高的成本的。如果没有成交,这些成本都白费了。业务人员的绩效中,也往往以成交作为度量的,成交越多,每月领的薪水就越多。所以从业绩的考虑,业务人员是有动力希望“通过率”变高的。

另外,“通过率”还会影响用户的体验。如果申请的贷款被拒绝的比例很高,客户很可能费了很多功夫,却不能借到钱,怨气就会很大,用户体验变差。但如果“通过率”很高,往往意味着风控能力比较弱,骗子们就会扎堆来钻空子,造成“坏账率”的急剧增高。

所以,“通过率”和“坏账率”这一对矛盾的指标,是金融公司业务部门与风控部门斗争的直观体现。而最终的结果,往往是两者之间的平衡,即在一定的坏账率范围内,争取更高的“通过率”,在一定的“通过率”的情况下,让“坏账率”尽量更低。这个平衡,不仅对内部的管理非常重要,也对公司的金融产品设计和用户体验有重大的影响。

时间: 2024-09-17 07:49:26

大数据风控指标----查准率与查全率的相关文章

电商社交数据在大数据风控的应用实践

随着普惠金融业务的深入,以及消费金融业务竞争的白热化,针对信用白户的风控显得尤为重要.如何面向信用白户进行快速有效的信用评级,卧龙大数据根据自己的实践经验,就电商.社交数据在风控上的应用价值与大家进行一些分享. 电商社交数据的数据覆盖度 卧龙和众多不同类型金融机构进行了数据匹配测试,下图为各类金融机构的互联网行为数据整体匹配情况. 可以看出: 传统的农商行主要面对线下人群,线上数据的匹配率很低,要利用电商社交数据做信用评估基本不可行,利用大数据引流获客倒是一个值得关注的方向; 对于大型股份制银行

真融宝:互联网金融精英时代来临 竞争依靠大数据风控

在金融行业监管趋紧的大环境下,互联网金融2.0时代正式来临.野蛮生长时代的过去并不代表竞争减少,相反,留下的精英企业会进入一个更具竞争压力的时代.在金融领域,最本质的环节便是风控,互联网金融公司要做好技术和风控之间的平衡.随着时代的发展,大数据风控进入人们的视野成为互联网金融重要的风控手段之一. 图源自网络 大数据风控是指通过运用大数据构建模型的方法对借款人进行风险控制和风险提示.与原有人为对借款企业或借款人进行经验式风控不同,通过采集大量借款人或借款企业的各项指标进行数据建模的大数据风控更为科

张新波 | 十面埋伏 - 论大数据风控技术体系的构建

2017.3.11,中生代技术嘉年华在上海盛大召开,6大主题.20话题,600多位小伙伴点燃现场,我们将会陆续将各话题整理发布,让大家共享这场技术盛筵. - 中生代技术嘉年华 - 张新波,同盾联合创始人&技术VP,为大家带来"十面埋伏 - 论大数据风控技术体系的构建" 主题分享,欲听详情,点击现场视频 同一个成语 - 十面埋伏,不同的场景有不同的含义 经验总结: 规则的可视化编辑 规则变更时实时生效 不同的规则应对不同的风险等级 复杂场景需要针对性的高级功能 规则测试 多维度存

大数据风控的现状、问题及优化路径

在互联网技术和信息技术的推动下,大数据在金融行业的风控中获得了引人注目的进展,但是在实际运用中其有效性还需进一步提高.当前大数据风控有效性不足既有数据质量的障碍,也有大数据风控的理论性障碍,还有数据保护的制度障碍.消除这些障碍.提高大数据风控的有效性,需要金融企业.金融研究部门和政府监管部门的共同努力. 大数据已经撼动了世界的方方面面,从商业科技到医疗.政府.教育.经济.人文以及社会其他各个领域.早在1980年,阿尔文 托夫勒(Alvin Toffler,1980)在<第三次浪潮>一书中就预言

网商银行俞胜法:大数据风控+平台化打造普惠金融能力

7月31日,在2016上海新金融年会暨互联网金融外滩峰会上,网商银行行长俞胜法表示,普惠金融不仅是一种愿景,还是一种能力,互联网金融.互联网银行想要去具备普惠金融的能力,需要从自身的风控能力,尤其是大数据风控加上合作平台 俞胜法介绍,网商银行开业一年多以来,服务了超过170万家小微企业,贷款余额达到230亿元,帮助千千万万的小微企业经营者.创业者去追逐他们的梦想,同时拉动了就业.支持了实体经济的发展. 利用大数据风控等技术优势,贴近电商经营解决小微经营者的融资难问题.众多的小微电商经营者缺少规范

后监管时代P2P生存路径:大数据风控能力是核心

争论P2P(下) 8月末,<网贷借贷信息中介机构业务活动管理暂行办法>落地,行业内各种声音此起彼伏,理不辩不明,9 月13 日,由21 世纪经济报道举办的"亚洲金融年会"之21新金融"P2P合规之路"闭门研讨会在京举行.来自监管.行业.法律.司法不同领域的人士,就新规给出了自己的真知灼见,行业的黎明已经到来,需要引导航向的灯塔. 导读 互金平台一位负责人表示,P2P的价值在于成为传统金融体系的补充,解决传统金融无法覆盖人群的金融服务."信息中介

数据智能,慧眼识“真”——个推大数据风控产品亮相

过去一两年,互联网金融迎来爆发式增长,其低成本.高效率.新模式的特点有效补充了传统金融机构的市场空白,承担着引导金融走向普惠的重任.与此同时,逾期率和坏账率高.欺诈申请较多等欺诈风险和信用风险也在日益攀升. 对互联网金融企业而言,传统风控手段成本过高.反馈结果慢,且覆盖率一般,而全场景风控产品误杀率又较高,都无法很好地满足风控需求,导致诸多互金机构面临着严峻的风控挑战. 近日,由联动优势主办的"第六届产品技术大会"在京召开.此次大会以"觉醒·Fintech"为主题,

想做大数据风控,先问问自己这几个问题!

大数据运用于互联网金融是近期一个异常火热的话题.不过细究起来,或许仍然概念性较强,不排除一些发展较好的平台,但从整体情况来看,大数据发展尚不成熟,还处于早期阶段. 想做大数据风控,先问问自己这几个问题! 大数据变现最好的状态是有数据源.能够进行数据挖掘.同时有用户的相关需求. 明略数据金融事业部解决方案专家杨昀举例表示,就像开采油田,基础是具有油田资源,核心是勘测开采需要的设备,加之用户资源需求,这才是一个行业应有的发展状态. 大数据运用于互联网金融是近期一个异常火热的话题.众多互联网金融平台动

大数据风控:理想很丰满,现实很骨感

年已近半,岁过中旬,2016年作为互联网金融(以下简称"互金")监管之年,整顿之年,如今上半年过去,一连串的数据显示,互金行业依旧混乱不堪,倒闭.跑路的企业依旧不绝,甚至有超过往昔的势头,截止4月底,全国累计成立网贷平台5022家,其中2200家出现问题,问题平台占比高达43.8%,累计近一半. 大数据风控面临的主要问题 现如今,许多互金行业都提倡大数据风控,希冀借助大数据来解决互金行业的问题,可是,理想和现实有很长一段距离. 在谈论互金行业问题时,安全问题成为大家关注的焦点,合众普惠