大数据中的金融市场监管

监管机构和投资者疲于应对高频交易(HFT)带来的难题。这种速度极快的计算机化金融活动如今占据了交易的大头。美国监管部门认为,高频交易一手制造了2010年5月的“闪电暴跌”(flash crash),令道琼斯工业平均指数(Dow Jones Industrial Average)突然大跌。然而,现在的高频交易已与三年前大不相同,这是“大数据”造成的。

大数据指的是过于庞大或复杂(或两者兼具)、无法用标准软件高效管理的数据集。金融市场是大数据的重要产生者,交易、报价、业绩报告、消费者研究报告、官方统计数据公报、调查、新闻报道无一不是它的来源。

第一代高频交易单纯靠速度来发现利用价格差异,依赖这种策略的公司近年来的日子不太好过。Rosenblatt Securities表示,与2009年相比,2012年高频交易公司的利润下降了74%。光快是不够的。我们与劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)的马科斯?洛佩斯?德普拉多(Marcos Lopez de Prado)提出,高频交易公司越来越依赖“战略顺序交易”(strategic sequential trading)。它包含的算法可以分析金融大数据,以识别出特定市场参与者留下的足迹。例如,如果一支共同基金通常在收盘前每一分钟的第一秒执行大额订单,能够识别出这一模式的算法将预判出该基金在其余交易时段的动向,并执行相同的交易。该基金继续执行交易时将付出更高的价格,使用算法的交易商则趁机获利。

这种新形式的高频交易可能会误入歧途,例如2013年4月23日的“无厘头暴跌”(hash crash)——美联社(AP)的Twitter账号发出巴拉克?奥巴马(Barack Obama)遭遇恐怖袭击的虚假消息,引发市场下跌。与2010年5月的那次暴跌不同,此次暴跌的罪魁祸首不是快速抛售引发的更多抛售。它不是快速交易导致的暴跌,而是大数据导致的暴跌。如果监管机构认识不到区别所在,它们将面临一种风险:新制定的规则只能解决陈旧、过时的问题。

大约两年前,对冲基金开始普遍从社交媒体提取市场情绪信息,其理念是利用Twitter、Facebook、聊天室和博客用户发出的成百上千万条消息,开发交易算法,判断出与各家公司有关的需求趋势。然而,这些算法通常无法利用小数据集做出有效的猜测。近几个月,一种算法流行起来——一旦有自然灾害或恐怖袭击等意外信息公布,便立即抛出订单。一个数据点出错就能导致“无厘头暴跌”,能够引发它的灾难性事件未来必定会上演。

坏消息是,若要应对新型高频交易带来的难题,就必须理解大数据与以往截然不同的挑战。好消息是,监管机构似乎认识到了适应变化的必要。本月,美国商品期货交易委员会(CFTC)专员斯科特?奥马利亚(Scott O’Malia)在纽约大学理工学院(NYU-Poly)大数据金融会议上表示,“鲁莽行为”正取代“市场操纵”,成为起诉不当行为的标准。例如,尽管利用从几百万条Twitter消息提取出的信息进行交易合情合理,但一旦算法在新闻通讯中发现“炸弹”和“白宫”两词便抛出大量订单,毫无疑问是鲁莽的。

一个重要的问题是,我们如何保证市场参与者负责地使用“大数据”?正如《哈佛商业评论》(Harvard Business Review)的文章所说,大数据需要大智慧。几年前,CFTC曾考虑是否应当让监管机构对交易商的算法进行认证。监管机构干预的潜在风险是巨大的,更不用说还有知识产权盗窃的风险。各方可以达成一种妥协:让市场参与者提出一系列追踪“鲁莽”行为的实时指标,例如在买家减少时增加市场抛售压力的行为。如果一家交易商逾越了多个“鲁莽”行为的临界值,它将可能被起诉。随着市场的演化,这些指标可以调整变化;最重要的是,它们可通过全体市场参与者的一致同意而制定。

利用美国国家实验室的资源是一种解决方案。劳伦斯伯克利国家实验室拥有超级计算能力和雄厚的分析技术,足以实时监控这些“鲁莽行为”指标,并且向监管机构汇报威胁稳定的鲁莽市场行为。传统的停市机制在市场暴跌后停止全部交易。相比之下,实时监控能够将单个参与者扫地出门,从而向诚信的参与者继续敞开市场。

大数据的使用正在改变市场。现在,我们需要改变监管市场的方式。解决高频交易问题的出路不是限制技术,而是鼓励对更复杂的技术乃至更大数据的利用。

(责任编辑:fumingli)

时间: 2024-07-28 14:06:32

大数据中的金融市场监管的相关文章

从大数据中“提炼”出商业见解,企业还有很多工作要做

编者按:随着互联网的普及化以及物联网的快速发展,人们产生的数据也越来越多.早几年前,马云就突出了当前是"DT"时代的说法.但数据的多并不代表着就是好事,只有被利用起来的数据才是好事.有人将数据称为是"新石油",这个比喻是非常恰当的.因为石油本身没有任何价值,它必须被提炼成汽油或塑料才有价值.同样地,我们都被大量的数据淹没了,但为了获得真正的价值,这些数据必须被提炼成商业见解.文章发表在ZDNet,由36氪编译. 我们生活在一个越来越依赖数据的社会,信息正变得和金钱一

从“大数据”中淘金很酷,但方法还很盲目

本文原载英国<金融时报>网站,原标题:Big data: are we making a big mistake,貌似我看到的时候已经有点晚了,但还是分享下吧.因为它确实讨论了我最近所思考的一些问题,是一篇思辨的文章.如果你以前没了解过大数据,这又可以看作一篇入门文章. 这篇文章只算一家之言,因为质疑总比证实更简单,但大数据现在炙手可热,这些反面的意见,如果作为谈资收藏起来,也是不错,说不定把妹子的时候会有妙用. by信海光微天下 大数据是对于大规模现象的一种模糊的表达.这一术语如今已经被企业

ACM图灵奖获得者:想从大数据中获益,先解决集成问题!

文章讲的是ACM图灵奖获得者:想从大数据中获益,先解决集成问题!如今,大数据对所有行业都产生了深远影响:从医疗保健.汽车.电信到物联网.随着数据浪潮的持续,企业都在寻找更新的管理和分析方法.收集可行的见解并应对安全和隐私的双重挑战. 计算机协会(ACM)刚刚结束了ACM A.M.50年的庆祝活动.图灵奖(俗称"诺贝尔计算奖")在旧金山举行了为期两天的会议.会议汇集了一些计算行业的翘楚,探讨计算机的未来发展以及该领域的领先地位.以下是与麻省理工学院计算机科学与人工智能实验室(CSAIL)

电子商务从大数据中挖宝必备五大要素

文章讲的是电子商务从大数据中挖宝必备五大要素,提到电子商务,自然会联想到大数据,如今"大数据"频繁地出现在媒体上,通过大数据,商家可以收集和分析数据,了解客户的购物模式和消费体验,从而改进产品设计,调整电子商务策略. 随着企业处理的数据量越来越大,数据处理工具的智能化程度越来越高,处理速度越来越快,价格也越来越实惠.大数据分析不仅仅是一种趋势,而是许多大型电子商务公司必不可少的一项工作内容. 1.驾驭大数据 数据集往往非常庞大,很难用传统的数据库管理工具进行处理,截至2012年, 数据

在大数据中发现大商机

当一切都可以量化,大数据本身就会说话.我们对商机的发现其实就是听的能力--只是传统的耳朵未必听得见"不可能"的声音. 从万事万物中提取数据并存储数据,这是大数据开发的前提也是产业链的上游 世界上万事万物都可以转化成数据,而"转化"本身就有着巨大的技术含量,因此,它无疑是产业链的上游. 在人类社会的发展历程中,计量从长度.重量不断扩展到面积.体积和时间,可以说相当漫长.19世纪随着科学家发明新工具,电流.气压.温度.声频之类的自然现象被量化,其间只经过了一两百年的时间

发掘大数据中的智慧 创造以客户为中心的业务转型

--IBM在沃森研究院成立客户体验实验室 4月8日消息,IBM宣布成立客户体验实验室(Customer Experience Lab),帮助企业高层领导者(C-Suite Leaders)通过移动.社交.云计算以及先进的分析技术转变客户体验产品.服务和品牌的方式.IBM客户体验实验室的总部将设在纽约州Yorktown Heights市Thomas J. Watson研究院,以IBM 全球12个研究院的研究人员为后盾.能够让企业的CEO.CMO.CFO.销售负责人以及其他首席高管直接接触到由IBM

企业何时才能从大数据中真正盈利?

大数据中蕴含着大价值,相信每一位关注IT技术创新的人都会听过这句话.没错,从http://www.aliyun.com/zixun/aggregation/13584.html">海量数据中筛选出有用的信息,然后通过各种手段将信息转化为洞察力,从而做出正确决策,推动业务发展.在这样一个信息链条中,企业需要确保每一个环节都不出错,才能将数据转化为价值.然而又有多少企业真正能做到这一点呢?少之又少!大数据很火,但是何时才能让大数据真正为企业带来盈利?对此,数据分析和市场营销专家Brooks B

大数据中的因果关系及其哲学内涵

"大数据"(big data)概念最早出现于<科学>杂志刊载的<大数据的处理程序>(1998)一文,此后<自然>杂志于2008年9月出版"大数据"专刊,短短十数年,"大数据"浪潮以人们难以想象的速度和让人始料未及的方式袭来.大数据一方面对传统的因果关系理论提出了挑战,另一方面又给因果概念的进一步展开提供了更高层次的整体观照.作为一种信息存在方式,大数据中因果关系和相关关系问题的错综交织,成为当前需要面对和思考的

【Spark Summit East 2017】管道泄漏问题:像女士一样在大数据中做个的标记

本讲义出自Kavitha Mariappan在Spark Summit East 2017上的演讲,主要介绍了如何应对大数据中的管道泄漏问题.