从巴西惨败看大数据预测

  今天凌晨4点,德国对巴西的世界杯本决赛给了所有人一个大大的惊叹号。德国7:1战胜巴西,让人瞠目,巴西如此惨败,实属难料。也许连谷歌的大数据预测也没有预测到7:1的悬殊差距。

  在这种情况下,讨论用大数据精准预测世界可能稍显牵强,但是毕竟,大数据预测是趋势。

  大数据发展到今天,虽然离完美预测还有一段距离,然而,不可否认,相信数据比相信直觉更加靠谱。抛开今天凌晨这场“大比分”的比赛不谈,谷歌、百度、微软等通过分析大数据对世界杯的前期预测准确的同样让人惊奇。

  “成功”预测世界杯16强?

  谷歌的云计算平台成功预测了世界杯16强比赛每场比赛的胜利者。据了解,谷歌使用来自实时体育比赛数据公司Opta Sports的数据,以及由BigQuery工程师乔丹·提加尼开发的实力排行榜系统,更考虑了观众热情程度数据,以计算出主队优势,从而预测赛果。此外,谷歌使用这一系统来预测世界杯8强的比赛,结果也惊人地准确:巴西对哥伦比亚,巴西胜概率为71%;法国对德国,法国胜概率为69%;荷兰对哥斯达黎加,荷兰胜概率为68%;阿根廷对比利时,阿根廷胜概率为81%。

  事实上,对于预测结果,谷歌并不是唯一做出完美预测的公司,百度、微软必应也进行了预测,大家的共同点都在于是依据云数据系统的综合分析来做出预测。

  随着大数据行业的发展,谷歌、亚马逊、阿里、百度、腾讯,都因为拥有大量的用户注册和运营信息,自然地成为大数据公司。各种数据的记录也许看起来是随机的,但是当这些数据由光速电脑进行分析之后,便会揭示出影像、模式、联系和趋势,不仅可以提高业务绩效,更改变生活。

  谷歌、百度等搜索引擎不仅存储了搜索结果中出现的网络连接,还会储存用户搜索关键词的行为,它能够精准地记录下人们进行搜索行为的时间、内容和方式,在你意识到自己要找什么之前预测出你的意图。

  猜考题、防疫情 大数据无所不能?

  去年春节期间,百度已经开始了对于春节人口流动趋势的预测;今年清明和五一,百度对全国各大景区、城市的人流热度做了预测,其针对2014年高考作文命题方向的预测更是“命中”了全国18套考题中的12套。据了解,百度的“高考预测”还可以利用历史搜索数据、历年的录取分数、各批次省控线预测全国各个大学的报考热度、难度,各种专业的报考趋势以及本省考生都对哪些专业、学校感兴趣等。百度CEO李彦宏表示,“对数据的挖掘整理只是大数据技术的初级阶段。除了通过大数据分析规律、趋势,机器必须还要会自主思考才行。”

  除了IT企业计划的疾病预测、房地产预测、就业预测、金融预测,我国疾控中心也计划运用大数据,提前确定一定规模的未知疾病,为疫情控制争取时间。

  不过,从目前来看,大数据的分析预测能力还远未完善。2009年,甲型H1N1流感爆发的几周前,“谷歌流感趋势”预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,并且非常及时,令公共卫生官员倍感震惊。不过,2013年,谷歌对于流感的预测与美国疾病控制中心汇总后的结果相比,夸大了几乎一倍。

  业界认为,未来“大数据的精准分析不仅有赖于数据资源的扩充,更要基于大数据引擎的发展进步。”据了解,IBM已推出大数据行业方案,英特尔入股了大数据初创企业Cloudera,还推出了基于Hidoop的“大数据引擎”。

  专家:

  数据协同和隐私问题待解

  谷歌、IBM、甲骨文、SAP等企业在大数据领域进行了技术创新,越来越多的国外企业凭借技术优势和先行经验进军大数据市场。然而,我国大数据产业发展仍然处于起步阶段。“每一次点击、触摸、短信、微信、微博、驾驶、飞行、通话、拍照、购买等都产生数据……虽然每天在产生大量数据,却没有显示出足够的威力。”赛迪顾问分析师表示,“交通部门有车联网、物联网、路网监控、船联网、码头车站监控等地方的大数据,卫生部门拥有流感法定报告数据、全国流感样病例哨点监测和病原学监测数据,公安部门有大量的视频监控数据,但政府部门几乎都没有大数据处理和挖掘技术。”

  除了互联网公司,沃尔玛、中国移动等传统企业也掌握着大量用户数据,平台企业互相独立地应用数据淘金,各取所需,但数据的私密占有严重制约着大数据的广泛应用和融合发展。“大数据的协同可以实现智能路径规划、运力管理、流感预测、疫苗接种指导、安防追逃等。”

  《大数据时代》一书中指出,“大数据本身探寻的是一种趋势,而非精准性,若要无限接近统计结果,必须让大数据与精细的传统统计方法互补,而非两者相互替代。”

  此外,数据的隐私问题也仍然待解。谷歌斥巨资投入的癌症预测项目中,仅有4%的癌症患者参与到了临床试验数据库项目中,这也就意味着高达96%病患的医疗和综合体征信息难以被其他医疗机构或者医生轻易获悉。

  部分内容摘自《广州日报》

时间: 2024-10-03 16:42:42

从巴西惨败看大数据预测的相关文章

大数据预测:4个特征,11个典型行业

世界杯期间各家科技巨头利用大数据预测比赛结果,再现"章鱼保罗"雄风.世界杯结束了但大数据预测还会继续.从夜观天象到气象预报,从童话里的水晶球到今日的科技预言家,从地震云的传说再到科学家猛攻的地震预测,人类一直希望能够更早突破局限看穿未来.随着信息革命的深入,大数据时代的预测更加容易,人类的生活正在被大数据预测深刻改变. 预测是大数据核心价值 人们在谈论大数据的采集.存储和挖掘时,最常见的应用案例便是"预测股市""预测流感""预测消费者行

大数据预测将会改变哪些行业?

中介交易 SEO诊断 淘宝客 云主机 技术大厅 [i天下网商注]世界杯期间各家科技巨头利用大数据预测比赛结果,再现"章鱼保罗"雄风.世界杯结束了但大数据预测还会继续.随着信息革命的深入,大数据时代的预测更加容易,人类的生活正在被大数据预测深刻改变.大数据预测的逻辑基础是,每一种非常规的变化事前一定有征兆,每一件事情都有迹可循,如果找到了征兆与变化之间的规律,就可以进行预测.大数据预测无法确定某件事情必然会发生,它更多是给出一个概率. 文/ Mr.Jamie 从天气预报看大数据预测的四个

大数据预测4个特征,10个典型行业

世界杯期间,全球各大科技巨头都利用大数据来预测世界杯比赛赛果,着实是让大数据在世界杯彻底火了一把.别以为世界杯结束了,大数据的预测就不会停止.从预测各种现象到夜观星相,从天气预报到飞机失事,从美好童话世界里的水晶球到现在的科技预测未来.随着信息革命不断的深入,大数据时代下的预测也变得更加简单,而人类的生活进入了大数据预测时代. 预测是大数据核心价值 人们在谈论大数据的采集.存储和挖掘时,最常见的应用案例便是"预测股市""预测流感""预测消费者行为"

大数据预测世界杯 八种方法谁靠谱

西班牙.英格兰连续两场失利,小组赛即遭淘汰,不仅让一些球迷伤心欲绝,让彩民损失不小,还顺便连累了众多预测世界杯的高人欲哭无泪. 这届世界杯在大数据火爆之后,不管是民间还是官方,都把大数据的概念运用到了世界杯预测上,但这些预测真的准吗?下面选取国内外主要的八种世界杯预测,对他们的预测方法进行简要的分析,看看谁的更准一些. 百度分析最传统 据验证,今年全国高考作文题目18卷中12卷的作文方向被百度大数据预测命中,被戏称"神预测".因此,这次百度收集网上的综合数据,然后进行整理.分析,最终通

若大数据预测世界杯靠谱谁会乐翻天?

最近,有报道称,一些公司利用大数据成功地预测了世界杯8分之1决赛的结果.不少人提出疑惑:若大数据预测世界杯靠谱,那谁会乐翻天? 一.有公司声称声场场预测准确 近日,对于利用大数据预测世界杯的报道屡见不鲜. 有公司声称他们利用大数据预测世界杯的结果准确率貌似很高. 例如谷歌.其产品营销经理本杰明·贝托谢姆(Benjamin Bechtolsheim)周三在一篇博客中表示,到目前为止,谷歌的云计算平台已成功预测了世界杯16强比赛每场比赛的胜利者.注意:是16强(即8分之1决赛)比赛胜利者. 谷歌称,

大数据预测世界杯不准

人类一思考,上帝就发笑:世界杯一来到,上帝笑得血压也升高.倒不是足球踢得多欢乐,而是世界杯预测太恶搞. 我略微总结了下,剔除掉贝利和大校这种声名卓着的反向指标,煞有介事的世界杯预测大致可以分为五类:一是实力决定论,以高盛和德银等投行为代表,将http://www.aliyun.com/zixun/aggregation/19351.html">FIFA排名.过往战绩.近期表现.球员身价.赌球赔率.国家经济等一系列数据综合反映出的球队实力作为预测依据,用计量模型计算出看上去精确至极的概率,只

看“大数据”如何完胜华尔街

今年有一句流行语"在大数据面前,你连底裤都不剩".而足球绝对是世界上运用大数据最领先.最成功的领域.就在刚刚结束的巴西世界杯,包括百度.微软等互联网巨头纷纷透过大数据业务,预测出了相当部分球赛结果.有人甚至大胆评价:在大数据面前,互联网公司完胜高盛.德银为代表的华尔街.2014年世界杯将成为一个新起点:大数据业务正式从单纯的技术走入日常生活的实际应用. 用什么模型很关键 今年世界杯没有"章鱼帝",但有央视美女主持"乌贼刘"和大数据公司的"

大数据预测雾霾以及存在的商机

近段时间,全国范围内尤其是京津冀地区接连陷入雾霾之困,北京更是频频发布空气重污染红色预警,中小学连续停课,机动车单双号限行.雾霾的背后,重污染天气的预警预测工作显得尤为重要,不仅可以让公众提前合理安排生产生活,也可以让政府相关部门及时采取应急措施,缓解重污染天气带来的危害. 郑宇 微软亚洲研究院主管研究员郑宇[麻省理工科技评论TR35(35名在科技创新领域具有杰出成就的35岁以下顶级青年创新者)2013年的获奖者,就是上图那位帅哥]一直从事大数据挖掘和算法研究,希望用大数据解决现代城市所面临的问

从5大行业领域看大数据场景应用

大数据定义 对于"大数据"(Bigdata)研究机构Gartner给出了这样的定义."大数据"是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力来适应海量.高增长率和多样化的信息资产. 随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注.分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱.大数据分析常和云计算联系到一起,因为实时的大型数