大数据在美国金融:一切数据皆为信用数据

导语:大数据到底在金融当中有什么用处?在美国是怎样被使用的?为什么错误的信息也是有用的?怎样处理大数据中的因果或者关联?大数据与立法之间有什么关系?

作者:顾凌云,Turbo Financial Group首席风险官

摘自:创业邦

目前为止,在大数据领域当中的投资已经越来越热,而且做得公司越来越多。有多少公司到底真正使用的是大数据?我相信几乎没有太多。

大数据在美国金融当中最直接的场景,就是所谓的信用评估体系。美国的信用体系评估很简单,就几样东西:债务历史、债务、信用历史时间、相关的其他因素。这些东西全部加起来形成了美国现有的评分体系。

一般来说,如果变量放得太多了,模型处理起来就会比较麻烦。最主要一点它的深度比广度要重要。所以,过去20年的记录,和最近一年当中才有记录,二者之间是不一样的。

另外,关注用户的历史远远多于现在,也许这个人一开始是个屌丝,最近突然发财了,可能他的偿还能力就会有巨大的改变,但是这样的因素有没有体现在这个里面?很多人不知道。怎样把纵向和横向广度上的东西都放进来,这个就会显得相对来说比较重要一点。

大数据到底在金融当中有什么用处?同样一个人在不同的应用和领域当中也不一样。比如今天在这个公司当中呆了20年,不一定说明他是个好员工,很有可能是他没有能力跳槽。如果你用另外一个角度评判这个人的话,你的评判标准和应用变量应该完全改变。但是非常可惜,没有人从这个角度上衡量一个人。

为什么最终会把风控放到一个这么重要的角度上来?像在中国的P2P公司,6个月或者一年之后,能剩下四分之一都是一个奇迹,很多P2P公司一定会死掉,或者被并购掉。在所有的热潮慢慢退去的时候,风控就会放到最显著的地位上来。

直接征询用户的答案也是很重要的。你可以在一个地方撒谎,你可以在两个地方撒谎,但是如果我大数据采了千千万万的点,很难把千千万万的点在互相不矛盾的情况之下,把它给伪装起来,如果真的能伪装成这样,那就不是一个欺骗的过程,所以很难通过大数据的方法让一个人还能够完全的编造一个不被识破的谎言,很难。

大数据模型理念,一切数据皆为信用数据。所有的那些关键变量,如果单独知道提出来一个,没有太大的用处能够判断出来这个人怎么样,但是如果把所有的这些细小的因素全部结合在一起,就会发现最后是非常强的指向,可以很准确的判断出来这个人到底在做什么。只看关联不看因果,这是一个非常重要的观点。

同样名字听起来很好,机器学习,咱们都会深刻的体会到,实际上是我们很悲催的学习机器,根本不是机器在学习我们。如何能够更好的跟机器进行沟通,我们给他一个方法,或者给他一个事实,他能够更快的从当中提取出来,更多的是一种互动。

大数据的模型之二,我们认为是数据的来源。即使错误信息也是信息,也体现了一个人的素质。

第三点就是所谓的建模,总而言之,大数据当中对所谓特征的变化,特征的提取和最后所谓独立模型细节的建立,最后模型的整合都跟以前传统统计上的理论有很大的区别。

最后这个是比较有意思的事情,这件事情在中国基本上不存在,但是在美国相对比较麻烦,大数据和相关立法之间的关系。相信中国在今后立法越来越完善也会碰到这样的问题,信用评估上有些禁区,这些禁区不能碰的。第一性别绝对不可以用的,来决定这个人到底信用值怎么样,这是绝对不可以的。第二年龄,年龄没有性别那么严重,但是年龄有要求,只能作为一个加分因素,而不能作为减分因素,年龄大家现在很多人也是不用的。第三种族,绝对不能触碰的红线,绝对不能根据是亚洲人、黑人、白人还是拉丁裔,判定你的信用是好是坏。比如在中国你在街上开车或者在美国,墙上写着字告诉你这个地方不能原地掉头,就是因为太多人在这个地方原地掉头了,所以才会树个牌子,如果这个地方窄,你不用写,也不会有人原地掉头。禁止使用的这些东西,其实真正最能体现一个人的本质。实际上从我们模型当中能看得出来,这些不准用的东西,如果用的话,比千千万万的信息加在一起都有用。

大数据另外一个比较奇怪的应用,就是它可以帮助你绕过一些法律上的红线,这并不是打法律的擦边球,而是因为事物的本质就是由这几个因素来决定的,A可以突出C,B又可以突出C,A和B之间必然有相关的。

原文发布时间为:2014-10-19

时间: 2024-10-29 10:31:27

大数据在美国金融:一切数据皆为信用数据的相关文章

金融大数据模型理念,一切数据皆为信用数据

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   到目前为止,在大数据领域当中的投资已经越来越热,而且做得公司越来越多.有多少公司到底真正使用的是大数据?我相信几乎没有太多. 大数据在美国金融当中最直接的场景,就是所谓的信用评估体系.美国的信用体系评估很简单,就几样东西:债务历史.债务.信用历史时间.相关的其他因素.这些东西全部加起来形成了美国现有的评分体系. 一般来说,如果变量放得太多了,模型处理起来就会比较

大数据时代美国带来的经验与启示

       奥巴马及其团队创新性地将大数据应用到竞选活动中,通过分析挖掘近两年搜集.存储的海量数据,寻找和锁定潜在的己方选民,运用数字化策略定位拉拢中间派选民及筹集选举资金,成为将大数据价值与魅力发挥到淋漓尽致的典型. 大数据时代,数据的作用前所未有地凸显,成为国家竞争的前沿.企业创新的来源.一直处于世界经济发展及信息技术发展与应用前列的美国,视大数据为"未来的新石油",给发展大数据赋予了非同一般的战略意义,并积极倡导和实践大数据的应用,已成为全球大数据领域的先行者.以美国为标杆,分

【干货】牛津博士讲大数据和量化金融

演讲全文: 很高兴来到这里,我是第二次参加这种会议了.我这次是以第二个身份来的,就是牛津大学NIE金融大数据实验室,代表实验室过来,今天主要分享一下我们实验室做的关于量化金融的思考跟案例. 首先简单介绍一下我们的大数据NIE实验室,是一个全新的实验室,是2013年11月正式成立的,我们实验室的定位是世界主要大学的第一个以金融大数据为研究方向的实验室. 我们是交叉学科的实验室,目的是把数据科学运用到金融领域,包括很多学科交叉在一起.因为我们的接口是牛津大学金融数学系,这个系框架上有金融.计算机.统

数据科学家岗位需求大 被评选为美国最佳工作

数据科学家这个职业被工作招聘网站Glassdoor在2016年被评选为美国最佳工作,这个职位是数据分析,经济学,统计学,以及计算机科学等传统职业的混合.数据科学家这个职业被工作招聘网站Glassdoor在2016年被评选为美国最佳工作,这个职位是数据分析,经济学,统计学,以及计算机科学等传统职业的混合. 大数据 虽然微软,Facebook和IBM公司等全球科技公司雇用了大多数的数据科学家(分别为227名,132名,98名),但是根据市场调研机构RJ Metrics公司的报告,这些专业人士也在非技

大数据成为物流金融研究的新型推进利器

上海是全球最重要与新兴的国际金融城市之一,金融创新是这座金融城市发展的血脉和抓手所在,而物流金融更是上海金融创新中的重头戏,物流金融研究与创新也到了关键和攻坚阶段.作为肩负物流金融研究责职和重任的上海浦东国际金融学会物流金融专业委员会及其物流金融研究院,比较与纵观国内外的长短优劣,并结合国内当前的实际情况,物流金融专业委员会及物流金融研究协会负责人黄青城指出:若要推进和加快物流金融的研究和创新,必须植入类似"龙芯片"和开发新型的"工具与装备"--大数据的摄取和引入,

开心贷周治翰:大数据是互联网金融未来的方向

CNET科技资讯网 6月5日 南京消息(文/梁议元): 6月5日,在2015互联网高峰论坛紫金之巅的演讲台上,江苏省互联网金融协会副会长兼秘书长.开心贷的副总经理周治翰做了题为<互联网金融的创新与自律>的演讲. 周治翰的主要观点是互联网进入金融行业可以带来更公平更高效地对接.并且他表示,未来大数据是互联网金融的发展方向. 互联网金融的从业者从事的是"一份很有前途的职业".周治翰认为,互联网金融可以在投资端和借款端之间实现很大的利润空间. 他给出了一组数据:美国十年期存款利率

大数据在互联网金融里占重要位子

互联网思想和互联网技术,是互联网对金融的变革中,重要的两部分.这两者就像世界观和方法论的关系,是互相辅佐和渗透的并且密不可分的. 互联网技术从深层次.具体化的角度解读可以分为:大数据.P2P人人组织网络和两面市场.其中大数据是最重要的因素之一.尽管金融没有类似实物的物理生产.仓储.物流等过程,但其本身就是数据的生产.仓储.挖掘.传输.分析和集成.所以大数据对于金融而言,是占非常重要的位子的. 大数据,是思维.技术与数据的三足鼎立.大数据不仅指规模庞大的数据,它首先是一种思维方式的变化,其次是对这

圆桌讨论:大数据和互联网金融

ZDNET至顶网CIO与应用频道 07月13日 综合消息:主题为"新银行 新蓝海"的2014年中国银行业座谈研讨会在青岛召开,会上圆桌论坛阶段来自文思海辉高级副总裁况文川.上海银行科技部副总邬敏伟.深圳农村商业银行产品研发部副总经理王鹏.文思海辉高级副总裁王闯舟共同探讨了大数据在互联网金融中的作用以及如何加以利用. 问:银行传统的网点优势是成本还是财富?下一步,包括互联网在内的多渠道的渠道转型方面,互联网金融创新方面有什么打算? 深圳农村商业银行产品研发部副总经理王鹏:银行的实体网点作

大数据如何改变金融?

◆ ◆ ◆ 序言 当今社会,庞大的数据及高端复杂的科学技术正在持续改变着产业的经营方式和竞争方式.每一天,世界上都有两百五十万的三次方的字节数据产生出来,这直接导致了仅在过去两年时间内就创建出世界上90%的数据.这种通常所谓的"大数据"的快速增长和存储,也创造出了很多机会:比如收集数据,处理数据,结构化和非结构化的数据分析等等. 在遵循大数据的3 V法则的基础上(后文会有详细介绍),各类组织通过对已知数据加以分析,帮助自己的公司作出更好的商业决策.这些已经采用大数据技术的行业包括:金融