大数据环境下,征信,真的那么美好吗?

不知从什么时候开始,征信仿佛一夜之间成了一个很热门的业务。也曾经看过很多文章,都描绘着征信未来广泛的应用,和庞大的市场份额。其间,虽然偶尔也有人出来泼冷水,但显然很快就被更为狂热的后进者所淹没。

众多代表着传统金融和互联网金融的大腕们纷纷摩拳擦掌,下场厮杀。BAT中除了B略微落后之外,AT直接进入第一批玩家的角逐。其余二线、三线互联网跟进者,数不胜数。

征信大军越来越大,名头也越来越响。这个集团,那个平台,各村有各村的高招。

征信,真的那么美好吗?真的是一个一本万利的大买卖吗?下面,我逐一为大家展开,大家自己判断。

为什么需要征信

征信是做什么用的,相信搞过金融的人都知道,它是信用风险定价的一个基础。很多文章都有详细的描述,这里我就不啰嗦了。但是,为什么要在这个时候提出征信?看了很多文章,感觉都没有讲清楚。

有的人说,是为了建设信用社会。这个话也对,也不对。从建立良好的金融秩序,对建立信用社会做出贡献而言,是对的;但从金融领域本身而言,征信与建设信用社会两者之间没有直接的关系。应该说,只有征信在金融环境里建立了良好的金融秩序,才能对信用社会做出贡献。

征信,在金融领域,就是为了“信用”的风险定价。而“信用”贷款,是金融行业发展到今天,所必然产生的一种形态。这是金融行业本身的一种成熟度的体现。金融行业经营的就是风险。从简单的有抵押物的普通信贷,到虚拟的无抵押物的复杂的”信用“贷款,是一种能力的提高。在这次升级中,“信用”,这种虚拟的事物,被当作了“抵押物”;而金融机构,也需要从对实物的掌握,转移到了虚拟事物的控制上。金融机构,需要具备更高的能力,才能迎接新的挑战,驾驭新的风险。

信用,不像可抵押物,你来或者不来,它就在那里。信用是一个看不见摸不着的东西,但它确实有价值。就如一个产品的品牌一样,它是有价值的。信用也一样,是你个人或者企业在社会中的一种类似于”品牌“的价值。

对这种“无形资产”的掌控,自然不能像可抵押物那样。它需要根据对企业或者个人信用的评估,预测出违约的概率,从而依靠这一概率,来计算对风险的定价。

所以,我认为,征信的产生是因为金融行业本身发展的需求。当然,可能刚好跟建设信用社会的理想同步,巧了。

如何征信

征信分为个人征信和企业征信。企业征信多为企业基本工商信息,信贷历史信息以及诉讼信息等的罗列,不作任何加工。企业征信目前在央行实行备案制,只要在央行那里备个案就可以做生意了;而个人征信因为要触碰到个人隐私,所以央行管理很严,相关企业需要申请,审核通过颁发牌照方可做业务。第一批八家征信牌照申请企业到目前依然还未获得牌照。

企业征信没什么好说的,信息的罗列,下面重点说说个人征信。

如何做个人征信在业界分为两派。一派是以传统金融企业为代表的“保守派”,还有一派是以互联网金融企业为代表的“新锐派”。“保守派”还是沿用传统金融领域的方法,通过信贷历史记录来评价未来的风险程度,形成征信分;而“新锐派”基本采用ZestFinance的多变量大数据方案来形成征信分。

“保守派”的方法虽然保守,但经过了数十年的检验,是成熟可靠的。它的缺陷在于传统金融机构对用户数据采集的时效性和完整性不好。但随着传统金融机构引入大数据的方式,与自身客户数据打通,就可以解决好时效性和完整性的问题,再加上体系的成熟,不失为一个今天最稳妥的方案。

“新锐派”的方法很炫丽,利用大数据的方法,采集了用户上万个变量的信息,对用户无限逼近。可以通过这些数据为每一个客户完整地画像。但是,从信用风险的角度而言,即使对客户再了解,也不可能弥补信贷违约历史记录的缺失。这也是目前“新锐派”最大的困惑。其征信分用于闭环体系没有丝毫问题,但如果跨出闭环,比方说用于线下,缺乏足够的实践证明。

当然,随着新生代人群对互联网依赖程度的加深,线上消费行为的比重加大,“新锐派”可能走出一条更好的路来。

这是后话,应该需要一个演进的过程。在这个演进的过程中,需要注意两件事儿。一个是行为的稳定程度,还有一个就是标尺的唯一性。

目前大数据征信主要采集的是互联网上的数据,它反映了一个人的行为特征。那么在征信的应用里,就要考虑这个行为特征的稳定性。只有稳定的行为特征才有被征信的必要。比如,我们早期的移动互联网应用,跟现在的就有很大不同,因为当时人们的很多习惯并没有养成。反映到数据上,就是杂乱无章,毫无秩序,而且不可重复。在没有养成稳定的习惯之前,数据是没有意义的,它不意味着任何事情。

征信是一个信用体系的基础,是一个金融秩序的根本。如果这个秩序乱了,那么一切都会乱了。大到好坏人的评价,小到信用风险定价的步长,不管是通过什么方法实现的,结果必须一致(允许一定误差内)。再好的故事也要为应用服务。美国的三大征信局,对每一个用户都有自己的评分,但一个用户在三大征信局里的评分,误差不会超过50分。道理很简单,因为几乎所有的银行都依据此去做风险定价,如果误差大了,标尺不一致,那么各家银行依此做出的风险定价就不一致,贷款的行为就会出现问题。所以,不管你用什么方法,说的再天花乱坠,一定要有统一的标尺。标尺错了,起点就错了,后面的一切基于这个起点的推断就都是错误的。

为什么不能沿用美国的征信体系

相信这也是所有征信的后来者所困惑的问题,为什么我们不直接照搬美国的征信体系?有的人说,国情不同。到底是什么国情不同?我认为,首先是基础设施的成熟度,其次是人们对信用的观念。

基础设施的成熟度,很容易理解,就是数据的完备。每个人的各项征信所需要的数据都很完备,可以很容易被采集到(当然只有征信局可以被授权使用这些数据)。美国的基础物理设施的成熟度,自然是国内无法比拟的。尤其是个人的隐私信息的管理,有一整套严格成熟的法律法规;而国内,还处于建设阶段。

所以,数据的采集渠道,就造成了在基础设施层面上客观的差异。这也是为什么央行不像美国那样只对三家征信局发放牌照的主要原因。 因为,我国没有统一的数据资源。

人们对信用的观念,初看起来有点虚,其实不然。基础设施的匮乏导致了我国不能采取美国的模式;而信用观念的建立,也不是一朝一夕可以完成的。信用观念的树立,代表了未来市场的成熟度。很难想象,一个成熟的市场中的用户,连信用是什么,我为什么要守信都不知道?!在北美等发达国家,公众有很明晰的信用观念,信用代表一切。所有去过北美的人会深刻感受到这一点,没有信用,寸步难行。只有越来越多的用户有了信用的观念,征信才会被越来越多地应用;也只有这个时候,征信才可以作为一项可以自给自足的业务,独立存在。

投入产出ROI

不知道谁第一个传出征信是一个一本万利的好买卖,“钱多,人傻,速来”!于是,大家就都来了。征信真的那么赚钱吗?

我来给大家算笔账。

先说投入。

目前代表互联网一方介入到征信领域的,多为本身就拥有庞大的网民数据(有to c入口)的企业,但由于即便是他们,业务的侧重不同,也没有办法拥有网民全部的数据。而且上面也分析了,我国还处于建设阶段,国家也没有一个统一的数据中心能涵盖所有数据源。所以,大家都需要跟别人去交换、购买其他部分的数据。

征信需要大量的数据,而且必须是高质量的数据。什么是高质量的数据?就是距离你个人真实情况近的数据。在这些数据里,最需要的是金融相关类数据,比如你的各种消费,你的收入等等。

数据质量越高,价格就越贵。按照目前金融属性比较明显的数据条目来计,每一个个人用户的成本在5-20元,如果征集的属性多,甚至要到50以上。一个征信机构,至少要覆盖1亿以上的人群,过低的识别率(征信用户查询有结果即为可识别)就会使征信机构失去存在的价值了。按照每笔5元的价格来计算,1亿用户就需要5亿的投入。这还没包括其它的基础设施投入等等。

在方法上,目前还没有找到一个在确实信贷历史数据,仅通过网民行为的大数据实现经得起推敲的征信方法,所以还需要继续寻找。这种寻找,又分成了两个方向,一个是继续沿着大数据的路寻找,也许未来某个时间能找到;还有一个就是自身收集金融数据,打通线上线下的数据,来补上信贷历史数据的缺陷。目前,AT都是走的这个路径。也就是AT没有直接去交易数据,而是利用强大的影响力,直接在线下合规地收集数据。每客户数据的获得成本,恐怕比上面的额度还要高。

无论是自己收集,还是直接交易,征信所需的数据都是一个庞大的投入。而且,这还是在自身已经拥有了庞大数据源的前提下。

大家已经知道了征信需要一个庞大的投入,下面再看产出。

虽然现在有的个人征信报告宣称6元一份,但有价无市。征信还是一个发展中的事物,其权威性还有待未来的数年去建立。在此之前,恐怕难有人为此买单。这就是目前市场的现状。

一方面需要巨大的投入,而另一方面又面临中短期的颗粒无收,征信真的那么诱人吗?我也赞同征信的未来是美好的,但你是否真的清楚这个过程的艰难呢?

个人征信之未来

从上面的分析中可以看到,由于个人征信业务的特点,不可能引入更多的机构进入。数据的匮乏是暂时的,不能因为数据的匮乏,而引入每一个垄断数据源作为独立的征信机构;而且,由于个人征信需要触碰到的是个人隐私数据,这就决定了不可能依靠大规模的交易来完成数据的补充。所以,其实多数企业都是与个人征信无关的。只有少数几个巨头,才有能力活到最后,才有资格去帮助政府做征信。在这里,数据+能力缺一不可。

从另一个角度来看,央行拥有3亿多用户的信贷数据,这部分用户,央行已经可以形成很完善的征信评分了。由于数据的差异,很难有第三方能够获取如央行那样完整的个人用户信贷记录数据,因此也很难有第三方征信机构,对用户做出科学的征信评分。所以,在这一市场引入额外的征信机构动力不足。

目前的问题是除了这3亿之外的用户如何评价?以 AT、京东为代表的互联网在这一方面有一定的优势。虽然玩的很热闹,但是今天,各家还没有形成一个类似于传统征信那样,真正经稳定,得起推敲的征信方法。我认为,无论从数据的稳定性上,还是从方法上,还需要假以时日。

有一个特例,那就是AT、京东只做闭环,为自身的业务服务。比如阿里为淘宝用户在淘宝购物上授信;腾讯为微信用户在购物时授信,那么今天,这个模型就是成立的,整个征信分也是科学的。

从用途上来讲,未来个人征信市场的格局将会有两种,一种是为自己服务的,作为自身互联网银行信用风险定价的征信机构,如AT、京东等,(当然,他们也可以对外提供服务,但前提是征信结果的达标);还有一种就是第三方独立的为公众提供服务的征信机构,他们的特点是有能力覆盖央行3亿用户之外的人群。

由于征信需要触碰个人隐私数据,不可能让更多的机构介入到其中。自身形成业务闭环的征信机构和第三方独立对外提供服务的征信机构可能是未来的两种形态。无论采用哪种方法,无论拥有什么数据,征信的标准是一定的。不应该因为这些方面的差异而造成结果的不同。

征信并不是每一个人的游戏,更不是一个一本万利的生意。它需要一个成熟的过程。在此之前,需要玩家们不断地投入。它需要玩家们投入去补充数据,去形成一套新的体系,建立央行3亿以外用户的评估方法。如果你留心,去几乎每一家餐馆,超市,商场,都会看到醒目的支付宝、微信支付可以支付的广告,而且还有优惠。AT已经在做线上线下数据的打通。假以时日,数据的积累达到一定程度,相信他们就可以跳出闭环,走向社会。

征信不是一个短期变现的生意,因为市场的成熟需要时间;征信的未来是美好的,但在短期内,征信需要持续的投入,而且是巨额的投入。在数据成本已经高企的今天,这真的不是每一个人的游戏。

征信有风险,投机需谨慎。

本文转自d1net(转载)

时间: 2024-08-31 14:43:33

大数据环境下,征信,真的那么美好吗?的相关文章

大数据环境下的地税预算执行审计

看起来纷繁复杂的海量数据资料,通过分析,可以发现很多有用的信息,可以告诉我们很多隐藏在数字背后的秘密,并有效提高决策的准确性.淘宝根据购物记录可以推荐买家可能会喜欢的商品,餐厅根据用餐记录可以推荐消费者可能喜欢的菜单.大数据审计分析可以通过对相关领域长年累月形成的数据的分析,挖掘出某种群体行为的特点,提示某种社会现象的潜在规律,为政府制定政策提供关键依据,同时还可以评估政府政策的实施效果,从而帮助政府不断发现问题,改进问题.下面笔者结合自己从事的地税审计业务浅谈在大数据审计分析中的心得体会,以达

【独家干货】大数据环境下的医疗产业变革

我们最近两年接触了非常多的行业,这些行业都意识到了需要在大数据环境下做一些行业变革,大家普遍感觉到,在中国的市场里有很多不一样的东西,尤其是在我们现在所说的新常态的环境之下,我们到底该做些什么样的调整,相信医疗行业大家也有同样的感触. 所以我这里首先先给大家看一下,刚刚结束的中央经济工作会议上,对于现在市场环境的判断,我们讲大数据.可穿戴,所有的这些东西,都必须是在这样的经济新常态下考虑这些问题. 这次中央经济工作会议上的很多观点,很多话语,我们感觉是非常接地气的,和我们的日常生活结合非常紧密的

畅想大数据环境下之个人信息的共享主义社会

在人类社会发展的过程中,"共产主义"一直是社会人憧憬的明天,且不论能否实现,其美好程度令人毋庸置疑.首先,那是一个高度发展的社会存在,充裕的物质财富可以满足所有人的需求,基于此的按需分配消灭了人与人之间的倾轧与掠夺:其次,那是一个高度文明的社会存在,社会成员具有高度的共产主义觉悟和道德品质,由此进行协作成长消灭了阶级冲突及所导致的社会矛盾:最后,那还是一个高度大同的社会存在,让以区域利益为核心的国家不复存在. 真正的共产主义,虽然还遥不可及,但一直是促动人类社会发展的一个美好愿景.遥望

大数据环境下的社科文献情报研究

信息技术正飞速发展,互联网已被普及利用,各种终端设备记录了人类社会复杂频繁的信息行为,从而产生了惊人的数据量.在大数据时代,数据分析被提升到了前所未有的高度.这无疑会给社会科学文献情报研究带来巨大的挑战,同时也使它迎来了重要的发展契机.本文对大数据分析和社会科学文献情报研究的关系进行对比研究,同时对大数据环境下社会科学文献情报研究的发展趋势进行展望. 大数据分析(Big Data Analytics,BDA)是指对大数据进行分析,从中找出可以帮助决策的隐藏模式.未知的相关关系以及其他有用信息的过

XFS:大数据环境下Linux文件系统的未来

本文讲的是XFS:大数据环境下Linux文件系统的未来,Linux有好多种件系统,但往往最受关注的是其中两种:ext4和btrfs.XFS开发者Dave Chinner近日声称,他认为更多的用户应当考虑XFS.他谈到了为了解决XFS中最严重的可扩展性问题所做的工作,还谈到了他认为将来的发展走向.如果他说的一点都没错,接下来几年我们在XFS方面有望看到更多的动静. XFS经常被认为是适合拥有海量数据的用户的文件系统.Dave表示,XFS非常适合扮演这个角色;它对许多工作负载而言向来表现不俗.以前往

大数据环境下的意图搜索技术!

尽管大数据已呈爆炸式增长,以致带动不少相关技术的衍生与发展.但是,不少人还是对大数据技术的作用感到云里雾里.今天,就跟随 大圣众包威客平台 一起看看大数据的其中一项重要技术--意图搜索技术. 一.大数据环境下的意图搜索技术的利弊 我们都知道,在大数据时代,任何在网络行为中留下的"蛛丝马迹"都以数据的形式被隐藏在大数据中,并通过应用物联网.大数据.人工智能等技术,构建成网络空间中的行为事件.思想事件等模型. 显然地,这种模式最大的风险是,它将面临信息安全问题.因为,在实体空间和虚拟空间中

大数据环境下金数据们的轻态数据服务还有机会

大数据是近几年IT业界中非常火热的一个词汇,由于当前主流的一些软件工具并不能满足人们对于巨量数据的挖掘.收集.整理.分析的需求的缘故,国内外都出现了不少根据这个痛点而进行突破的大数据服务企业. 当IT数据领域主流的发展目标都致力在大数据服务上的时候,那些针对中小团队甚至个人的数据服务是否又还是拥有较大的市场继续挖掘呢? 国庆放假期间,偶然间在微信朋友圈中打开了一位微信好友分享过来的问卷调查链接.问卷调查的内容没有太多复杂的选项,很多需要你选择的地方都是一个相对比较广泛领域中少数的几个选择.虽然我

大数据环境下的网络安全挑战分析

文章讲的是大数据环境下的网络安全挑战分析, 大数据架构和平台算是新事物,而且还在以一种非凡的速度不断发展着.商业和开源的开发团队几乎每月都在发布其平台的新功能.当今的大数据集群将会与将来我们看到的数据集群有极大不同.适应这种新困难的安全工具也将发生变化.在采用大数据的生命周期中,业界仍处于早期阶段,但公司越早开始应对大数据的安全问题,任务就越容易.如果安全成为大数据集群发展过程中的一种重要需求,集群就不容易被黑客破坏.此外,公司也能够避免把不成熟的安全功能放在关键的生产环境中. “大数据”一词常

大数据环境下的多维分析技术

之前我们有一篇文章< 一文读懂多维分析技术(OLAP)的进化过程 >为大家介绍了多维分析技术(即联机分析处理(On-Line Analytical Processing),简称OLAP)的前世今生及发展方向.正是由于多维分析技术在业务分析系统的核心功能中的不可替代性,随着商业智能系统的深入应用,分析系统的数据量呈指数级增长,原有依赖硬盘IO处理性能(包括传统数据库.多维立方体文件)的多维分析技术遭遇到性能瓶颈.与此同时,随着服务器内存价格的下降,一种新的基于内存的OLAP技术架构出现了.这种新