看“大数据”如何完胜华尔街

今年有一句流行语“在大数据面前,你连底裤都不剩”。而足球绝对是世界上运用大数据最领先、最成功的领域。就在刚刚结束的巴西世界杯,包括百度、微软等互联网巨头纷纷透过大数据业务,预测出了相当部分球赛结果。有人甚至大胆评价:在大数据面前,互联网公司完胜高盛、德银为代表的华尔街。2014年世界杯将成为一个新起点:大数据业务正式从单纯的技术走入日常生活的实际应用。

用什么模型很关键

今年世界杯没有“章鱼帝”,但有央视美女主持“乌贼刘”和大数据公司的“对赌”。最终理工男设计的数学模型打败了央视美女的好运气,央视体育频道主播刘语熙在预测中败给了百度。

据记者了解,2014年巴西世界杯期间,百度,微软、谷歌等国内外技术巨头和大投资银行高盛、德意志银行乃至彭博等,均推出了大数据预测。

互联网公司方面,除了雅虎,几乎全面大胜。百度、微软、谷歌预测正确了全部的16强(谷歌只预测了八强),以及八强;微软、百度对了全部的四强,谷歌在四强的预测中惜败;在半决赛中,百度和微软甚至还准确预测了巴西对德国的赛果。而本来一向预测准确的雅虎,今年被认为为推广业务而乱用模型,才导致预测结果错误大半。

相反,高盛、德银和彭博三家传统的华尔街公司则错得离谱。今年高盛世界杯报告的出品人是大经济学家凯文·戴利(Kevin Daly),他带领高盛的量化分析师建立了自1960年以来正式国际足球比赛数据的模型,对其进行回归分析。但高盛的八强预测错了三个(哥斯达黎加、比利时和哥伦比亚),四强错了一个(西班牙),小组赛的赛果正确率只有37.5%。

彭博的方法与高盛类似,是在各国国家队FIFA积分的基础上,模拟了1万次比赛结果,结果也与高盛类似,彭博认为西班牙会在和阿根廷打平后点球进入决赛,最终输给巴西,但实际情况则是西班牙早已回家。

德意志银行的模型更离谱,它的模型据说综合了FIFA排名、历史战绩、球员构成和赌球赔率等因素,计算结果是巴西无缘8强,而英格兰将夺冠。

今年或成大数据元年

业内分析认为,受云计算能力的局限,高盛、德银、彭博为代表的华尔街公司采用的数据并不够庞大,是导致他们计算错误的主因。其实回顾往届世界杯,几大投行的预测都是瞎猜。上一届大摩说英格兰会夺冠,瑞银说意大利能进四强,与实际结果均差距甚远。

“大数据最缺的不是技术,而是应用。”艾媒咨询董事长张毅说。而业内普遍认为,随着对大数据业务的发掘,2014年世界杯将成为国内大数据业务正式成熟的起点。

据百度相关人士介绍,目前,百度大数据已经在旅游、教育、赛事产业进行了多次尝试,部分产品有望在年内实现商业化。继世界杯之后,百度大数据预测还将相继推出票房预测、房地产预测、金融预测、中小企业指数预测等一系列产品,并在9月中旬的时候推出预测开放平台,最大程度地开放百度在大数据领域的数据和技术能力,推动整个大数据行业的快速发展。百度还刚刚从谷歌大脑挖来了人工智能三位顶级专家之一吴恩达,并宣布“百度大脑”已经达到2~3岁智力。

世界杯预测准确率

百度:预测在16场世界杯淘汰赛,仅在3、4名决赛中失手,最终取得16场15中的成绩,预测准确率为93.75%。而今年频频爆冷的小组赛阶段,百度对比赛结果的预测准确率也达到了58.33%。

微软:微软成功预测出世界杯淘汰赛16场比赛全部胜负结果。它甚至在巴西对德国半决赛之前,就预言到德国人将在巴西人主场横扫主队。而今年频频爆冷的小组赛阶段,微软得出56.25%的准确率。

高盛:高盛预测巴西将捧杯笑到最后,现在我们看当然知道高盛的预测错得离题。经计算,高盛对本次世界杯的预测准确率只有34%。

观点

大数据不可尽信

有本地经济学者则向记者表示,大数据系统再强大,也无法避免“黑天鹅”事件的出现。经济学博士陈龙认为,由于世界杯这种顶尖赛事,球员都是最顶级的球员,发挥失常的概率非常低,大数据才有可能配备上用途。“但如果是更复杂的经济估算,大数据系统失败的风险就高得多。”

“实际上每一场国际足球赛背后都有巨大的赌博集团在操控,大数据不能全信,否则你会输得很惨。”有本地资深球迷则向记者表示。

(责任编辑:mengyishan)

时间: 2024-07-31 10:00:35

看“大数据”如何完胜华尔街的相关文章

用"数据"说话 从SACC看大数据应用之道

文章讲的是用"数据"说话 从SACC看大数据应用之道,正如<大数据的冲击>的书中提到的那句话:"Google.Amazon.Facebook.Twitter,这些称霸全球互联网的企业,它们的成功都具备一个共同的因素,你知道是什么吗?"当然不是商业模式,因为他们的商业模式不尽相同.当然也不是客户服务,尽管这个很重要,那这其中最重要的共同点恐怕就是大数据技术的应用. 曾经有人说互联网将改变很多的行业,但在热衷大数据技术的人眼里,真正改变那些行业的并不是互联网

从5大行业领域看大数据场景应用

大数据定义 对于"大数据"(Bigdata)研究机构Gartner给出了这样的定义."大数据"是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力来适应海量.高增长率和多样化的信息资产. 随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注.分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱.大数据分析常和云计算联系到一起,因为实时的大型数

坐看大数据之道:51CTO专访大数据专家郑玮

大数据已经渗透进人们生活的方方面面,比如商店促销决策.政治活动指引等等.究竟大数据目前发展状况如何?51CTO专访大数据专家郑玮将为您讲述大数据之道. 专访视频专题,请访问<坐看大数据之道> NoSQL与大数据 NoSQL最早出现时,主要是Twitter这些社交媒体网站在用.因为他们需要处理每时每刻用户上传的海量图片.视频等非结构化数据.大数据概念提出之后,由于其在非结构化数据方面的优势,迅速融入大数据整体平台. HBase在大数据平台发展较快 为什么之前XML数据库没有成功?NoSQL的数据

王珊看大数据 - 产品和技术

王珊看大数据 发布时间:2012.05.16 09:22      来源:赛迪网     作者:赛迪网 大数据时代的到来,数据带来了爆炸式的增长,数据设备使真实世界能够被数字化处理,数据由量的积累而产生了分析处理价值. 中国人民大学信息学院教授.博士生导师王珊表示,大数据的来源主要来自互联网公司Facebook.大型企业.电信.金融等行业的简单数据类型和结构化数据.现在Facebook拥有强大的数据仓库.互联网和电子商务的发展使数据库技术面临着海量数据处理的挑战,需要高度的可扩展和高度的可伸缩.

气象信息化:看大数据如何拨云见日

ZDNET至顶网CXO频道 08月11日 评论分析:数据之前,有一个与之相似的概念--BI.BI提供了一种因果关系,从因果关系导出模型.大数据脱离了因果关系的横向模型,关注海量数据,海量数据本身就是价值所在.从通过对谷歌5000个搜索关键词的跟踪,美国政府准确地推断出某一地区即将爆发大规模流感,从而提前采取防控措施.还有强大的数据分析团队通过建模,帮助奥巴马稳获总统宝座.大数据屡屡显示其威力,已经渗透进每一个领域.当然,气象领域也绝不例外.越来越多的人意识到,天气不再仅仅是影响人们生活和出行的信

从Facebook看大数据存储怎么选

最近有位朋友向我咨询技术问题,他们的客户提出一个大数据系统的服务器硬件需求,其中元数据有xxTB左右.并给出了以下初步建议: 节点类型1(元数据节点) Xeon E5 14核CPU x2 256GB DDR4内存 600GB SAS 15K硬盘x5 RAID卡 节点类型2(数据节点) Xeon E5 14核CPU x2 128GB DDR4内存 4TB 7.2K近线硬盘x4 RAID卡 软件并非我擅长的方面,不过大数据概念炒了好几年,从各方面还是多少了解到一些Hadoop/HDFS硬件架构方面的

在阿里召集的数据群英会上,数据先锋们都怎么看“大数据”?

2014年3月7日,阿里巴巴对外开放的数据峰会"2014西湖品学大数据峰会"在杭州召开.会上,阿里巴巴方面披露了目前该公司的数据储存情况. 目前在阿里数据平台事业部的服务器上,攒下了超过100PB已处理过的数据,等于104857600个GB,相当于4万个西雅图中央图书馆,580亿本藏书.仅淘宝和天猫两个子公司每日新增的数据量,就足以让一个人连续不断看上28年的电影.而如果将你代入成服务器,你处理的数据量则相当于每秒钟看上837集的<来自星星的你>. 目前全球仅有两三家公司计

彭博“暗窥门”看大数据时代的心理地图价值

大数据开发部分实现了原本只有上帝能做到的对人类心理的洞悉.随着现代数据采集如视频监控云的形成和走向云存储,数据的威力越来越大,通过云数据,甚至可以描绘出一个人或亿万人的生活轨迹.兴趣爱好,他们喜欢去哪些店铺,愿意在哪里活动,服饰爱好如何,经常跟谁在一块儿--.无疑,彭博社早已掌握了这一上帝的真传. 彭博打造了全球金融精英俱乐部 迈克尔·布隆伯格和瑟康达于1981年创立了彭博社.彭博近年一直处于大举扩张态势,纵使在金融危机期间也是大举投资,但仍坚持通用型终端的策略.目前,在全球约有15,000名员

从另一个视角看大数据

大数据是当下最时髦的话题之一,依照迈尔·舍恩伯格及库克在<大数据时代>的描述,数据被定义为不用随机分析法(抽样调查)而运用所有数据的方法.除了对于社会组织.公共服务.人们生活的重大影响之外,这一热潮背后的关注焦点,其实还是商业模式,即相关数据仓库.数据安全.数据分析.数据挖掘等围绕大数据的商业价值利用. 大数据之所以在我国引起如此大的关注,也是由于在传统文化理念中,"大概齐.差不多"的习惯深入人心,在公共决策.商业选择.个人行为中充斥着"拍脑袋"现象.正