当大数据遇上世界杯,虽不完美,却让人欣喜

今天凌晨4点,德国对巴西的世界杯本决赛给了所有人一个大大的惊叹号。德国7:1战胜巴西,让人瞠目,巴西如此惨败,实属难料。也许连谷歌的大数据预测也没有预测到7:1的悬殊差距。

在这种情况下,讨论用大数据精准预测世界可能稍显牵强,但是毕竟,大数据预测是趋势。

大数据发展到今天,虽然离完美预测还有一段距离,然而,不可否认,相信数据比相信直觉更加靠谱。抛开今天凌晨这场“大比分”的比赛不谈,谷歌、百度、微软等通过分析大数据对世界杯的前期预测准确的同样让人惊奇。

“成功”预测世界杯16强?

谷歌的云计算平台成功预测了世界杯16强比赛每场比赛的胜利者。据了解,谷歌使用来自实时体育比赛数据公司Opta Sports的数据,以及由BigQuery工程师乔丹·提加尼开发的实力排行榜系统,更考虑了观众热情程度数据,以计算出主队优势,从而预测赛果。此外,谷歌使用这一系统来预测世界杯8强的比赛,结果也惊人地准确:巴西对哥伦比亚,巴西胜概率为71%;法国对德国,法国胜概率为69%;荷兰对哥斯达黎加,荷兰胜概率为68%;阿根廷对比利时,阿根廷胜概率为81%。

事实上,对于预测结果,谷歌并不是唯一做出完美预测的公司,百度、微软必应也进行了预测,大家的共同点都在于是依据云数据系统的综合分析来做出预测。

随着大数据行业的发展,谷歌、亚马逊、阿里、百度、腾讯,都因为拥有大量的用户注册和运营信息,自然地成为大数据公司。各种数据的记录也许看起来是随机的,但是当这些数据由光速电脑进行分析之后,便会揭示出影像、模式、联系和趋势,不仅可以提高业务绩效,更改变生活。

谷歌、百度等搜索引擎不仅存储了搜索结果中出现的网络连接,还会储存用户搜索关键词的行为,它能够精准地记录下人们进行搜索行为的时间、内容和方式,在你意识到自己要找什么之前预测出你的意图。

猜考题、防疫情 大数据无所不能?

去年春节期间,百度已经开始了对于春节人口流动趋势的预测;今年清明和五一,百度对全国各大景区、城市的人流热度做了预测,其针对2014年高考作文命题方向的预测更是“命中”了全国18套考题中的12套。据了解,百度的“高考预测”还可以利用历史搜索数据、历年的录取分数、各批次省控线预测全国各个大学的报考热度、难度,各种专业的报考趋势以及本省考生都对哪些专业、学校感兴趣等。百度CEO李彦宏表示,“对数据的挖掘整理只是大数据技术的初级阶段。除了通过大数据分析规律、趋势,机器必须还要会自主思考才行。”

除了IT企业计划的疾病预测、房地产预测、就业预测、金融预测,我国疾控中心也计划运用大数据,提前确定一定规模的未知疾病,为疫情控制争取时间。

不过,从目前来看,大数据的分析预测能力还远未完善。2009年,甲型H1N1流感爆发的几周前,“谷歌流感趋势”预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,并且非常及时,令公共卫生官员倍感震惊。不过,2013年,谷歌对于流感的预测与美国疾病控制中心汇总后的结果相比,夸大了几乎一倍。

业界认为,未来“大数据的精准分析不仅有赖于数据资源的扩充,更要基于大数据引擎的发展进步。”据了解,IBM已推出大数据行业方案,英特尔入股了大数据初创企业Cloudera,还推出了基于Hidoop的“大数据引擎”。

专家:

数据协同和隐私问题待解

谷歌、IBM、甲骨文、SAP等企业在大数据领域进行了技术创新,越来越多的国外企业凭借技术优势和先行经验进军大数据市场。然而,我国大数据产业发展仍然处于起步阶段。“每一次点击、触摸、短信、微信、微博、驾驶、飞行、通话、拍照、购买等都产生数据……虽然每天在产生大量数据,却没有显示出足够的威力。”赛迪顾问分析师表示,“交通部门有车联网、物联网、路网监控、船联网、码头车站监控等地方的大数据,卫生部门拥有流感法定报告数据、全国流感样病例哨点监测和病原学监测数据,公安部门有大量的视频监控数据,但政府部门几乎都没有大数据处理和挖掘技术。”

除了互联网公司,沃尔玛、中国移动等传统企业也掌握着大量用户数据,平台企业互相独立地应用数据淘金,各取所需,但数据的私密占有严重制约着大数据的广泛应用和融合发展。“大数据的协同可以实现智能路径规划、运力管理、流感预测、疫苗接种指导、安防追逃等。”

《大数据时代》一书中指出,“大数据本身探寻的是一种趋势,而非精准性,若要无限接近统计结果,必须让大数据与精细的传统统计方法互补,而非两者相互替代。”

此外,数据的隐私问题也仍然待解。谷歌斥巨资投入的癌症预测项目中,仅有4%的癌症患者参与到了临床试验数据库项目中,这也就意味着高达96%病患的医疗和综合体征信息难以被其他医疗机构或者医生轻易获悉。

部分内容摘自《广州日报》

(责任编辑:吕光)

时间: 2024-10-09 12:13:36

当大数据遇上世界杯,虽不完美,却让人欣喜的相关文章

大数据遇上“工业4.0” 万亿级产业机遇隐现

从产品生产.企业运营.物流运输再到精准营销,大数据似乎可以从各个方面参与,并且改变制造业的发展现状.而在风险与机遇并存的转型过程中,制造业企业必将遭遇众多的技术困难与理念障碍. 工信部长苗圩撰文解读我国制造业如何由大变强时称,当前的重点是推动互联网在制造业领域深化应用,积极发展云制造等基于互联网的新型制造模式,培育工业互联网新应用,建设一批工业云服务和工业大数据平台.大数据被当作制造业连接互联网的命脉,互联网大佬们称,大数据是区别传统制造业和智能制造的关键.大数据给制造业带来的价值,似乎正在逐渐

当大数据遇上风控 互金公司必须清楚这两点

不知何时起,大数据开始风靡各个领域,从餐饮到购物再到旅游......大数据频繁应用到各行各业的市场拓展中.而对于互金公司来说,言必称大数据似乎也成为了一种潮流. 然而正如财经评论家陈宇(江南愤青)所提到的,在手机贷中"为什么能够在一分钟之内实现放贷?数据哪里来?数据的成本到底有多少?数据分析有效性有多强?".关于大数据的方方面面,确实还是个很大的未知数. 精细化管理阶段 发展大数据风控成必然 对于互联网金融企业来讲,恒昌首席战略官翟南宾表示其核心竞争力就是做好风险定价,本质上即是怎样识

当大数据遇上中国女人

坊间有俗语:"女人的钱更好赚".但百度将目光聚焦于"中国女人",显然有更深层的原因. 周迅再次来到戛纳,在2014年的夏天.不过这一次,她并非出现在自己熟悉的电影节,而是戛纳创意节. 当地时间6月17日,戛纳Audi A会场.会场全天的议题为"DATA, INSIGHT, STRATEGY & CREATIVITY"( 数据.洞见.战略及创意).下午4点15分,是百度专场时间.周迅和麦当劳(100.47, 0.10, 0.10%)(中国)

大数据遇上大型机 结果会如何?

 进入数据大爆炸时代,企业所面临的局面无疑更复杂了.看着日益累积的各种数据,相信有不少用户都有这样的感觉:明知面前是座金矿,却苦于没有合适的开采方法,只能任机会流逝. 当然,并不是所有用户都在坐等时机,也有不少在尝试的.比如有用户在用分布式平台进行数据的整合.存储.分析.应用,也有用户在用集中式平台进行相关的工作,同样还有用户从分布式平台转向集中式平台. 究竟谁好?各有各的道理,不妨看个具体的案例,从中或许能受到一些启发. Banca Carige实践心得 Banca Carige Group

Science:当大数据遇上公共卫生

导语:通过大规模降低噪声,大数据可以造福全人类 1854年,一场霍乱席卷了整个伦敦.有个叫John Snow的流行病学家(现代流行病学的创始人),一心要找出霍乱爆发的源头.他历尽千辛万苦,记录了所有受到霍乱影响的房屋位置.经过了漫长且费力地调查,他终于确定了Broad Street上的水泵是这次霍乱爆发的源头,即使那时候他还不知道霍乱是某种Vibro病菌引起的情况下."如果换做现在,Snow就可以充分利用全球定位系统和流行病规律数据,在短短数小时内解决了问题." 这是"大数据

当大数据遇上云计算,相辅相成更为强大

目前而言云计算和大数据已经成为了一个十分强大的趋势,但是这两者相结合之后会变得更加强大.云计算能够使大数据的价值被更好地进行挖掘,而大数据则能够为云计算带来全新的业务机会,更好的客户定位与产品创新等. 如今全世界的数据量每天都以数倍的速度在进行快速增长.大数据的主要功能在于捕获.存储和分析来自客户.消费者.供应商.运营商.合作伙伴或雇员等处的大规模数据.从麦肯锡的一份调查报告来看,目前全美的来自所有行业部门的公司中,每一家平均都有数百TB的大数据.并且这一数据还将伴随着公司和客户的交易行为等而继

大数据预测的世界杯靠谱吗?

问: 今年大数据取代了章鱼保罗,成为预测世界杯战局的热门手段.不过这种预测靠谱吗?大数据真的能预测世界杯? 答: 目前采用http://www.aliyun.com/zixun/aggregation/13568.html">大数据技术预测世界杯的,既有百度这样的互联网公司,也有德银这样的知名投行. 一.预测确实使用了大量数据 通过采访百度的相关人士,我们发现百度预测世界杯的主要数据来源包括:百度搜索数据,球队基础数据,球员基础数据,赔率市场数据.百度大数据通过分析过去5年987支球队的3

盘点:大数据史上的“神预测”和“乌龙预测”

随着疾病预测.世界杯预测的火爆,"大数据"成了每个IT圈人士张口闭口离不开的话题,好像一切都朝着苹果6 的潮流发展--"bigger than bigger",越大的就是越好的.随着大数据的不断应用创新,大数据预测日益被人们"神话",100%准确率似乎成为了人们衡量大数据能力硬性指标,但事实并非如此.神乎其神的大数据预测有"显灵"一刻,也有"乌龙"一刻.今天小编就带领大家来盘点下大数据史上的关键时刻. 大数

碳云智能CEO王俊:大数据基础上人人都将活到120岁 | 2017 IT领袖峰会

雷锋网4月2日消息,2017中国(深圳)IT领袖峰会于今日召开.在下午的论坛<颠覆性技术与人类未来>中,斯坦福大学物理系讲座教授.美国国家科学院院士张首晟.碳云智能创始人兼CEO王俊.超多维科董事长戈张.康得新复合材料董事长钟玉参与了该场高端对话. 其中,王俊认为生命本身就是数字化,它是一个运行的程序,人类正在尝试理解程序的编译方式和运行原理.相较于人工智能在其他领域的应用,生命科学的大数据时代远远没有到来,但在可预见的未来,生命科学数据将实现飞跃式的发展.他提到生命这套程序的设计就是120岁