百度玩转大数据 要做“章鱼帝”

  今年世界杯,巴西队首场对阵克罗地亚的胜率是72%,平局的概率则有20%!

  厄瓜多尔有52%的几率望成为黑马,洪都拉斯异军突起的可能性只有7.8%,当然,这个黑马榜15个“种子选手”中,根本没有中国。

  这是谁说的?

  当然,不会再是那个有预知功能的章鱼保罗了,那个神奇的“大人物”已经在四年前预测完世界杯冠军后撒手“鱼”寰……这是百度大数据计算的结果,公布在百度“trend”中。

  世界杯就像一场狂欢盛宴,任何可以被抓住成为焦点的可能都被尽量放大。

  继章鱼保罗一举成名后,今年有更多精灵动物浮出“球”面:德国再次推出动物明星大象;英国派出一只名犬参赛;中国当然是把国宝熊猫拿出来趁机吸引眼球——成都动物园让熊猫宝宝通过选择食物的方式来“预测世界杯”;听说日本也想博出境,想来想去找了一只名为“英太郎”的猴子参与竞猜——并且已经预测出日本将进入四强。

  不过,人们是否还会对动物预言帝感兴趣?有谁会相信猴子、大象、熊猫也会是预言帝?无论怎么看,这都更像是一场半真半假的“国宝秀”。

  而本次世界杯的预测帝新趋势是技术派——走大数据路线的百度、霍金和高盛。

  人人都要做“章鱼帝”

  还记得2010年时章鱼保罗一共做了14次预测:其中预测正确的居然高达13场,正确率接近93%。当然,有人说当年章鱼帝保罗哥预测的这14场比赛最终都分出了胜负,没有一场平局,也是保罗预测精确度之高的原因之一。

  但如果说2010年的章鱼保罗是世界杯真正的主角——整个世界杯似乎就是为了证明这只年仅两岁的章鱼预言真伪而存在,那么2014年的巴西世界杯的动物“预测”则完全成了一场笑话的前奏。

  而就在这个越来越乌龙的动物争宠战进行过程中,百度则试图用大数据来证明预测世界杯的成败乃是一个靠谱且科学的过程,当然,这或许也是告诉世人——尤其是那些对大数据存疑的人,大数据是否真实可靠的一个最佳秀场。

  百度商业运营体系副总裁向海龙透露,预测世界杯冠军和本届比赛的黑马在百度内部都被看成是一个非常有趣的项目。当然百度也预测每场比赛谁赢谁输。

  “我们不是瞎预测,这个大数据的背后,百度综合了1000支球队、最近五年、37000场的比赛,还有29610名球员的数据,此外,还结合了252万条网民的搜索请求,以及全球1.1亿基础数据整合到一起。”向海龙强调,“产品创新对于基础设施提出了更高的要求。”

  向海龙表示,这样的计算能力并不是一个公司短期内能够达到的。目前,百度已经收录了全世界超过一万亿张网页的100PB数据,相当于5000个国家图书馆的信息量总和,几乎记录了整个中国互联网的发展史。同时,百度上每天有百亿次的访问请求,离线完成1000亿网页的处理与分析。而时效性网页从更新到索引只需要几十秒,真正做到了在大数据量级下的低延迟、秒级响应——只有这些硬性条件都成熟,才敢称百度的大数据有这样的能力。

  而本次世界杯预测模型,是由百度深度学习研究院派遣资深数据科学家协助大数据部研发团队共同构建,世界杯预测模型的准确度在主队胜与不胜的判定上达到75%-80%。

  从世界杯到一切?

  而除了动物外,本届世界杯也不止百度一家是“技术派”,霍金和高盛也一起难以遏制对世界杯足球的赌性,他们甚至都推出了计算公式。

  例如霍金的公式中,甚至包括英格兰队获胜和天气之间的关系——气温仅提升5℃,夺冠几率就可能会下降59%……脆弱的英格兰队的胜负跟球衣颜色、阵型、是否长途飞行、是否欧洲裁判都有莫大(博客,微博)关系。

  在高盛的报告中,英格兰队的命运被判定为“比较悲催”。例如小组赛阶段英格兰队出线的概率只有54.3%,而同组的意大利和乌拉圭分别是69%和57.5%……

  而百度的预测中所分析的球队,不仅包括207支国家队,还包括欧洲、南美洲、亚洲等主要联赛俱乐部球队以及部分低级别俱乐部球队的信息。据百度内部透露,之所以将俱乐部赛事数据考虑进去,是为了发现更多和比赛结果相关性较高的内在和外在因素,以丰富和优化预测模型。

  但是百度也在做减法,他们只选择了过去5年的数据来进行分析,是因为考虑到过去5年的数据更能够反映本届世界杯各个球队的真实情况,使用太多的历史数据将会在一定程度上增加数据的噪音,反而增加了数据分析的难度,也降低预测的准确度。

  事实上,李彦宏也在百度联盟峰会上讲过,大数据时代,“数据太多”是一种误导,因为现在每天产生的很多数据是“无价值的”。

  不过,如果说霍金和高盛是纯“学术”派研究来玩玩的话,那么百度做的世界杯预测,则已经显露出大数据与彩票业、保险(放心保)业结合的巨大商业空间——现在在百度预测的页面上,用户可以直接下注购买世界杯赛事的彩票,服务提供方之一是平安彩票。

  在百度的页面上,不仅有“足彩投注”按钮,可以按一注12元、两注24和五注60元三种方式买,甚至有“不中赔偿”,用户只要购买了和百度预测结果一致的彩票,一旦真实结果和预测不符,平安保险将对彩民进行部分赔付。

  以巴西对阵克罗地亚的比赛为例,百度预测巴西队取胜的概率超过七成,平安保险为这场比赛投入5万元作为赔付金,如果克罗地亚爆冷战胜巴西队,那么通过平安彩票买巴西胜的所有用户可以均分5万元;如果巴西战胜克罗地亚,这5万元将累积到下一场“不中赔偿”的比赛。

  这显然是百度前向收费业务推进的结果,这家公司在试图努力开发对个人的前向收费业务,而世界杯就是一个最好的切入口:从获取信息,到下注购买,到百度钱包支付,形成一个闭环。

  在未来,百度还将在赛事彩票、保险、甚至球员潜力挖掘方面逐步深入。例如在赛事彩票领域,百度大数据将利用大数据技术为彩民提供更加科学、可靠的投注参考数据;在保险领域,将联合平安保险创新险种,在彩民购买彩票的同时给予彩票保险来保证最后的收益以及减少投注不中的损失,而彩票保险的背后所涉及的定价过程将依赖赛事预测模型来进行操作。

  百度显然是在尝试,是否能把体育比赛的商业机会挖掘得更加淋漓尽致,而在这里面,无论是彩民还是玩家,都能更有效地通过大数据分析来利用“必然中的偶然”和“偶然中的必然”。例如用大数据帮助百事可乐选定代言人吴莫愁,与万科集团合作打造智能商业地产,都是在试图让大数据与传统产业相结合。

  而在这次世界杯之后,百度还计划推出疾病预测、房地产预测、票房预测、就业预测和金融预测……看来,百度是要做一切公众事件的“章鱼帝”。

时间: 2024-10-26 07:09:55

百度玩转大数据 要做“章鱼帝”的相关文章

抗衡互联网冲击,购物中心要玩转大数据

大数据.云计算.互联网--这些虚拟空间的名词正在跟实体产业融合,互联网与传统行业之间的界限越来越模糊,飞凡.喵街.大众点评加上不计其数的O2O产品让实体商业变得越来越好玩,人们在虚虚实实之间享受着"互联网+"带来的方便.经济和愉悦感. 与此同时,还有一大批实体商业正在忙碌地编织着适合自己的互联网.大型的购物中心开始铺设免费Wi-Fi.导入Beacon微定位技术.建设在线商城.开展朋友圈营销--不亦乐乎地为迈进"互联网+"新时代准备着. 智慧商业,过去只存在于人们唠嗑

百度预测:大数据应用层出不穷 传统行业拥抱世界杯商机

近日,百度预测推出了一款名为"世界杯预测"的新产品,其核心亮点在于将互联网大数据第一次运用到了体育赛事中,并能够以具体的"胜.平.负"的百分比概率,对3721.html">2014年巴西世界杯的各阶段赛事.冠军队和黑马队做出预测. 借百度预测的世界杯预测结果,中国平安保险特别有针对性地推出了创新彩险为"世界杯预测"做担保,彩民只要根据百度预测的结果购买相应场次的足彩,若预测出现错误,平保险安就将为彩民提供部分赔付.有分析人士表示,

教辅书如何“玩转”大数据

近日,一套名为"学霸必刷题"的教辅书在学生中间引起热烈反响,不少读者反映这套书特别适合备战中考和高考的学生使用.据悉,该丛书由华东师范大学出版社和学霸君APP联合推出,是国内首本将"互联网大数据"和"名师"相结合的中学教辅类图书.在6月18日~28日预售期间,华东师大出版社天猫旗舰店和官方微店已有超过3万余订单,由于预售期数量限制,甚至曾一度出现"一书难求"的状况. 如今,传统教育出版单位更多涉足融合了互联网技术的产品,特别是

Facebook教你如何玩转大数据

不论"大数据"概念是不是个陷阱,我们的时代,互联网巨头坐拥海量信息是无人可以否认的事实,社区产品和社交产品赖以生存的基础就是从用户那儿来的数据. 他们都是怎样八仙过海.各显神通让你感受到大数据的?比如,去年年终的时候,你肯定看到众多好友在微信朋友圈儿分享了一张"订制"的图片,在微信产品成长历程的时间轴中标注你加入的时点:你可能在登录豆瓣电台后,才发现通过一个特别的回忆通道,豆瓣已经帮你记录了一年来的音乐足迹,从哪天注册哪天听第一首歌哪天听的很悲伤--无一遗漏:如果你

规划为道 同方数据资源体系玩转大数据

文章讲的是规划为道 同方数据资源体系玩转大数据,大数据的应用前景之大已经毋庸置疑.据Gartner发布的<大数据驱动基础架构>报告显示,2013年大数据带动的IT支出有望达到340亿美元;到2016年,全球在大数据方面的总支出将达到2320亿美元.Gartner还强调,大数据工具在2014年将被视为一种必要投资. 当前,越来越多企业将大数据的分析结果作为其判断未来发展的依据.同时,传统的商业预测逻辑正日益被新的大数据预测所取代.不过,海量数据只有在得到有效治理的前提下才能进一步发展其业务价值.

正确的理解,是玩转大数据的前提

眼下,无论是高校还是科研机构,以"大数据"为关键词的研讨会一拨接着一拨,云计算.物联网.智能终端--这些新概念串烧着出现,仿佛"大数据"正撬动着一个非"技术宅"免进的新世界. 到底什么是大数据的真面目?英国帝国理工学院终身教授.帝国理工数据科学研究所所长郭毅可给出的却是一个举重若轻的解释."大数据首先不是概念,而是一种现象.一种新发现的资源.就如同人类发现了新的石油一样--对大数据的发掘意味着可以创造财富,也正因此,大数据会引发一系列的

大数据营销做什么?怎么做?做得怎么样?

1.谁在做大数据营销? 大家都说自己在做大数据营销. 基于: 业务:和市场营销相关,因此政府机关单位数据不考虑.体量:拥有足够多有价值的数据.这一条很多互联网企业和传统大企业都能满足.技术:有技术能力处理大数据. 上面3个因素,国内能做大数据市场营销的还真只有BAT三家.国外的不熟悉,这里不谈. 众所周知,三家的数据特点各不相同.腾讯优势在社交数据:阿里巴巴优势在商品和交易数据:百度优势在全网信息.消费者行为和主动需求数据. 当然例如平安.宝洁.沃尔玛这样的大企业,其自身肯定积累了大量的数据,基

聚焦数字营销 看中美巨头如何玩转大数据

大数据已经算不上新事物,它已经从根本上改变了诸多行业--比如音乐.报纸.电影.零售等等.在数字营销领域,依托新技术的大数据所带来的改变更是颠覆性的. 聚焦数字营销看中美巨头如何玩转大数据 争夺数据资源巨头们开疆辟土 互联网广告曾被谷歌占据:亚马逊称霸在线零售:社交网络的巨头是脸书:而苹果公司则建立了交互式硬件设备的行业标准,被称作"人们数字生活的遥控器". 这也是美国互联网市场的现状.你可能认为四家公司能够很好地诠释市场细分,在零售.广告.硬件和社交网络各显其能,然而这并不是全部.这仅

CIO沙龙深圳站:金融/制造业玩转大数据

本文讲的是CIO沙龙深圳站:金融/制造业玩转大数据,在互联网+.中国制造2025以及工业4.0的浪潮下,传统企业豁然开朗,似乎找到了转型升级.改革创新的救命稻草.但事实上没这么简单,面对这些大而空的概念,企业没有做好准备很难抓住这波机会,转型将是空谈,无法落地. ▲点击报名参加 找转型良方,来深圳CIO沙龙现场 机会不会从天上掉下来,而是需要企业掌握必备的基础能力,比如制造企业如何借助大数据技术,做到生产制造的精细化管理,节约企业经营成本,最大化市场竞争空间.金融企业如何借助大数据技术分析用户行