盘点:大数据史上的“神预测”和“乌龙预测”

  随着疾病预测、世界杯预测的火爆,“大数据”成了每个IT圈人士张口闭口离不开的话题,好像一切都朝着苹果6 的潮流发展——“bigger than bigger”,越大的就是越好的。随着大数据的不断应用创新,大数据预测日益被人们“神话”,100%准确率似乎成为了人们衡量大数据能力硬性指标,但事实并非如此。神乎其神的大数据预测有“显灵”一刻,也有“乌龙”一刻。今天小编就带领大家来盘点下大数据史上的关键时刻。

大数据史上的“神”预测

  2009年,谷歌推出“流感趋势预测“项目,在甲型H1N1流感暴发的几周前,“谷歌流感趋势”成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,并且非常及时,令公共卫生官员备感震惊。此举一炮打响了谷歌在大数据预测的地位。

  3721.html">2014年,百度大数据预测团队通过对海量赛事信息的挖掘和分析,对2014年巴西世界杯全部64场比赛的胜负结果,以及冠军和黑马进行预测。无论是四分之一决赛还是16强淘汰赛,百度预测结果准确率都达到100%!斩高盛,赢谷歌,世界杯预测彻底火了百度。

  在天气预测方面的“预测帝“是美国EarthRisk公司,该公司利用大数据对未来天气情况作出预报,它采用的预测模型项不同于以往的数值预报模式,可基于 820 亿次计算以及 60 年的气象历史数据来识别天气模式,然后将这些模式与当前的气候条件进行比较,再运用预测性分析进行天气预测,其预测时间更长、预测准度更高,最长可提前 40 天生成冷热天气概率。传统主观预测模型在EarthRisk面前简直是弱爆了。

数据史上的”乌龙“预测

  2011年至2013年间,谷歌流感趋势预测开始走下坡路,从2011年8月到2013年9月108周中,它高估了流感流行趋势超过50%。英国《自然》杂志报道称:在最近一次流感暴发中,“谷歌流感趋势”不起作用了!这个工具曾经可靠地运作了几个冬天,在海量数据分析和号称“不需要理论模型” 的条件下,提供了快速、准确的流感暴发趋势。而这一次,谷歌产品显示的数据,与美国疾病控制中心汇总后的结果比起来,夸大了几乎一倍!项目多数高估了类流感发病率。

  遭遇了流感预测的低谷,谷歌预测再逢强敌。在今年的世界杯预测,四分之一决赛前,百度、谷歌、微软和高盛就对世界杯四强进行了预测,结果显示,这一次百度、微软、高盛三家对结果进行了准确预测,而谷歌只准确预测到四强中的三支队伍。预测结果是否准确,预测模型的构建的作用十分关键,正是因为微软、高盛、百度、谷歌采用了不同的预测模型,才导致了它们之间预测结果的差异。与百度的高准确率相比,谷歌、微软、高盛恐怕要齐齐反思下这次的失误了。

  可是,世界杯的余温刚刚散去,百度在9月底推出的电影票房预测首次试水也遭遇了小小的尴尬。在产品上线的内测阶段,百度预测《黄金时代》的票房为2.0~2.3亿,10月16日,《黄金时代》的累计票房为4698万(已上映16天),如此成绩对于片方、媒体和公众而言都是出乎意料,对于百度预测来说也是一次“乌龙”。

  当今互联网行业发展风起云涌,“大数据”炙手可热。大数据预测的前提是承认其不确定性,有对有错,有成有败。我们不能因为某一次偏差,而全盘否定大数据的技术和成果。尽管这些项目目前暂时还存在缺陷,但这并不足以否定大数据对社会的潜在贡献。任何新生事物都有一个发展的过程。大数据预测功能在各行各业的价值,有些已经顺应天时地利而突显,有些还需假以时日才能达到人们理想中的要求。我们有理由相信大数据的未来价值也会和这时代潮流一样“bigger than bigger”。

时间: 2024-10-03 15:26:25

盘点:大数据史上的“神预测”和“乌龙预测”的相关文章

大数据持续升温 2014年6项大胆预测

文章讲的是大数据持续升温 2014年6项大胆预测,这是个气温变幻无常,消费者跌跌绊绊,预言家不断摸索的季节.诚如2014年开始,我们对大数据进行的一些大胆预言,这些大数据的预言真的将会成真吗? 大数据在2014年将会如何发展?当然任何人都可以对未来进行猜测,但是我们认为我们自己已经根据战斗在大数据战壕的高管们的形形色色的预言,为您准备好了一个关于大数据的美味假期.所以,不容迟疑,快来看明年大数据的六大预测: 1.更多的Hadoop项目会遭遇失败而不会成功 这一可怕的评估是由大数据应用平台公司的C

大数据遇上“工业4.0” 万亿级产业机遇隐现

从产品生产.企业运营.物流运输再到精准营销,大数据似乎可以从各个方面参与,并且改变制造业的发展现状.而在风险与机遇并存的转型过程中,制造业企业必将遭遇众多的技术困难与理念障碍. 工信部长苗圩撰文解读我国制造业如何由大变强时称,当前的重点是推动互联网在制造业领域深化应用,积极发展云制造等基于互联网的新型制造模式,培育工业互联网新应用,建设一批工业云服务和工业大数据平台.大数据被当作制造业连接互联网的命脉,互联网大佬们称,大数据是区别传统制造业和智能制造的关键.大数据给制造业带来的价值,似乎正在逐渐

大数据玩家们对2013年趋势的预测

本文讲的是大数据玩家们对2013年趋势的预测,本文来自ZDnet的记者Adrew Brust的博客文章.主要陈述大数据业内人士对2013年发展的预测和作者自己的一些观点. 在大数据领域,虽然对技术产业的预测是不可缺少的,但是Adrew对宣传一个具体公司的计划明显缺乏兴趣,而且许多业内公司都把他们明年的计划发给了Adrew,所以他认为:如果能把这些2013年的预测整合一下,再融入自己的观点,将是一件非常有意思的事情. ▲图:Big Data将会在2013发展到哪个阶段? Hadoop的2013 首

“谷歌流感趋势”把大数据推上风口浪尖

大数据是时下最时髦话题,技术专家.企业家为人们描绘了大数据下的美好生活.近期,美国学界和媒体有关"谷歌流感趋势"的讨论,又把大数据推上了风口浪尖. "谷歌流感趋势"是谷歌公司多年前推出的一款预测流感的产品.该公司的工程师认为,搜索流感信息的人数与实际患病人数之间存在密切关联.通过汇总用户的相关搜索记录,"谷歌流感趋势"可以预测出世界上不同国家和地区的流感传播情况.2009年,http://www.aliyun.com/zixun/aggregat

大数据产业链上生财之道

从走在大数据发展前沿的互联网新兴行业,到与人类生活息息相关的医疗保健.电力.通信等传统行业,大数据浪潮无时无刻不在改变着人们的生产和生活方式.大数据时代的到来,给国内外各行各业带来诸多的变革动力和巨大价值. 据研究企业MarketsandMarkets公司最新发布的报告称,全球大数据市场规模将在未来五年内迎来高达26%的年复合增长率--从今年的148.7亿美元增长到2018年的463.4亿美元.全球各大公司.企业和研究机构对大数据商业模式进行了广泛地探索和尝试,虽然仍旧有许多模式尚不明朗,但是也

碳云智能CEO王俊:大数据基础上人人都将活到120岁 | 2017 IT领袖峰会

雷锋网4月2日消息,2017中国(深圳)IT领袖峰会于今日召开.在下午的论坛<颠覆性技术与人类未来>中,斯坦福大学物理系讲座教授.美国国家科学院院士张首晟.碳云智能创始人兼CEO王俊.超多维科董事长戈张.康得新复合材料董事长钟玉参与了该场高端对话. 其中,王俊认为生命本身就是数字化,它是一个运行的程序,人类正在尝试理解程序的编译方式和运行原理.相较于人工智能在其他领域的应用,生命科学的大数据时代远远没有到来,但在可预见的未来,生命科学数据将实现飞跃式的发展.他提到生命这套程序的设计就是120岁

摩拜AI大数据平台“魔方”发布黄金周骑行预测,加州开发 AI 智能公寓

AI大数据平台"魔方"发布黄金周骑行预测 8天长假前,摩拜通过大数据人工智能平台"魔方",对假期全国各地的骑行特征与趋势做了一次预判. 据"魔方"预测,由于海量休闲观光需求的释放,预计"十一"期间的日均骑行量将增长25%:相应地,人均骑行距离将从平均不足2公里增加至近3公里:骑行速度将降低15%,每公里骑行将多花1分钟时间.与工作日的明显早晚双高峰不同,小长假期间的骑行将呈现午前小高峰.下午2点到5点大高峰.晚间8-9点第二小

别轻易给大数据扣上“嫌贫爱富”的帽子

文章讲的是别轻易给大数据扣上"嫌贫爱富"的帽子,市场的事还是多让市场自己说话,别轻易给大数据扣上"嫌贫爱富"的帽子,只要别在人前炫耀,别把我的个人隐私四处张扬,怎么生活都与别人无关. 这两天的微信朋友圈,最热的话题不是什么心灵鸡汤,而是广告.微信的朋友圈广告,据说针对不同收入的人群推送了不同的广告,一时成了身份和地位的标识被热议. 自打小广告从电线杆纷纷挪到互联网.电话.手机短信中以后,小伙伴们还从来没有像这一天这样渴望过被广告骚扰.有人被宝马车广告砸中,忙不迭地在

政府在大数据问题上不要大包大揽 要充分尊重市场规律

"政府在大数据问题上不要大包大揽,要让企业成为市场推动的中坚力量,充分尊重市场规律,进一步推动改革." 国家发改委城市和小城镇改革发展中心主任李铁在数博会"国家大数据综合试验区建设"论坛上发表主题演讲.他认为,未来大数据产业发展中,政府在大数据问题上不要大包大揽,要让企业成为市场推动的中坚力量,充分尊重市场规律,进一步推动改革. 李铁说,在传统数据和移动端数据中,所有用户的数据都是很清晰的,关键是怎样推进政府数据开放与市场相结合,这涉及传统数据怎么和未来海量信息结合