关于啤酒和尿布故事的真相

数据刚刚兴起时,常常听厂商或大数据倡导者说这个啤酒和尿片的故事,鲜活、形象地说明大数据分析给商业带来的无限商机。如果你没有听过的话,我们再讲一遍:

“尿布和啤酒,听起来风马牛不相及,但这是对历史数据进行挖掘的结果,反映的是数据层面的规律。这种关系令人费解,这是一个真正的规律吗?经过跟踪调查, 研究人员终于发现事出有因:一些年轻的爸爸经常要到超市去购买婴儿尿布,有30%到40%的新爸爸会顺便买点啤酒犒劳自己。沃尔玛随后对啤酒和尿布进行了 捆绑销售,不出意料,销售量双双增加。”

——摘自涂子沛的《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》

第一次听到这个故事时,其实心中有惑 。以笔者对美国社会的有限理解,美国很多州的法律是不允许超市卖酒类商品,仅在最近几年才开始陆续有些州通过法律,允许超市申请酒的销售执照。但当时被大数据的热潮所吸引,也就无暇深究。最近参加了一些和大数据相关的活动,这个故事又不绝于耳。终于决定探探这个故事的源头。

原来这个故事在欧美国家也被传唱,出现的版本还不尽相同。但对此质疑的声音也不少,其中有一位叫Daniel J. Power的教授特此撰文,应该是最全面地有理有据揭开这个故事后面的真相。有兴趣的同学可以详细阅读英文全文:What is the "true story" about using data mining to identify a relation between sales of beer and diapers?。主旨内容如下:

  • 这家连锁店不是沃尔玛,而是Osco Drugs,一家主要在美国中西部经营的药房和便利店。
  • 该公司于1992年就着手进行数据挖掘项目,算是数据挖掘的先驱者。
  • 当时的项目收集了来自25家分店、一千两百多万个购物车的信息。
  • 数据的确发现:下午5点到7点之间,客户购买了啤酒和尿片。
  • 商店管理层的确对此发现表示兴趣。但现实中,并没有重新设计商品的摆放,没有把啤酒和尿布进行捆绑销售。不过,公司保守地对销售流程进行了改造,即在正确的时间放正确数量的正确商品。

这就是啤酒和尿片的故事真相,所以,这其实并不是数据挖掘的好故事。大家对此故事津津乐道,无外乎希望表达:数据挖掘技术是商业决策的好帮手!

本文作者:Shirley Xie

来源:51CTO

时间: 2024-09-01 02:25:56

关于啤酒和尿布故事的真相的相关文章

数据仓库——在“啤酒与尿布”中挖掘

数据 数据仓库--在"啤酒与尿布"中挖掘01-5-21 下午 04:19:25 对话者:主持人:程鸿--<计算机世界>报记者专家:孟晓峰--中国人民大学信息学院教授祁国辉--"数据仓库之路"网站主持人IT厂商:杨顺生--NCR大中华区市场及合作伙伴总经理用户:陈道斌--工商银行信息管理部处长(博士)对话主题:数据仓库在中国的应用前景如何?  数据仓库的门槛有多高?主持人:自从"啤酒和尿布"的故事

名家定义大数据:啤酒与尿布

信息爆炸时代,大数据统计降临到商业.经济.政治等领域,成为备受推崇的决策工具.大数据成为一场基于时代发展的IT洞察,是基于人类生产生活所带来的数据和人机.机器与机器之间更紧密通讯带来的数据聚合.甚至有人说:得大数据者得天下. 但是,大数据到底离我们有多远,是不是只有决策者才需要大数据,或者说大数据只是为决策者服务的?答案显然是否定的,在这个大数据时代,我们每个人都是大数据的创造者,每个人也都是大数据分析福利的享用者. 随着互联网+,工业4.0等概念的提出,我们更要认清,国家正在加大力度让传统政府

除了啤酒与尿布 大数据又助电商玩口碑营销

在快消行业,啤酒与尿布成了大数据应用的经典案例:全球零售业巨头沃尔玛通过对消费者购物行为进行分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是沃尔玛将啤酒和尿布陈列在一起,大大提升了两种商品的销量. 如今产业升级,越来越多消费者选择电商而非实体超市购买商品,大数据的应用也不再局限于商家手里掌握的销售数据,而是转向如今网络时代更为关心的用户参与感.口碑传播,在这其中,用户在电商平台上留下的大量评价数据,便成为了解口碑传播的关键,成为新的金矿. 电商时代的口碑--用户评论

好商品的秘密:啤酒与尿布成为神奇购物篮?

在一家超市中,人们发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品居然摆在一起.但这一奇怪的举措居然使尿布和啤酒的销量大幅增加了.这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实案例.原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布.而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒,这个发现为商家带来了大量的利润,但是如何从浩如烟海却又杂乱无章的数据中,发现啤酒和尿布销售之间的联系呢?这又给了我们什么样的启示呢? 好商品?坏

【玩转数据系列四】听说啤酒和尿布很配?本期教你用协同过滤做推荐

(本文数据为虚构,仅供实验) 产品地址:https://data.aliyun.com/product/learn?spm=a21gt.99266.416540.102.OwEfx2 一.背景 数据挖掘的一个经典案例就是尿布与啤酒的例子.尿布与啤酒看似毫不相关的两种产品,但是当超市将两种产品放到相邻货架销售的时候,会大大提高两者销量.很多时候看似不相关的两种产品,却会存在这某种神秘的隐含关系,获取这种关系将会对提高销售额起到推动作用,然而有时这种关联是很难通过理性的分析得到的.这时候我们需要借助

频繁项集挖掘算法之FPGrowth

背景:         频繁项集挖掘算法用于挖掘经常一起出现的item集合(称为频繁项集),通过挖掘出这些频繁项集,当在一个事务中出现频繁项集的其中一个item,则可以把该频繁项集的其他item作为推荐.比如经典的购物篮分析中啤酒.尿布故事,啤酒和尿布经常在用户的购物篮中一起出现,通过挖掘出啤酒.尿布这个啤酒项集,则当一个用户买了啤酒的时候可以为他推荐尿布,这样用户购买的可能性会比较大,从而达到组合营销的目的.         常见的频繁项集挖掘算法有两类,一类是Apriori算法,另一类是FP

大数据集群部署与管理

一.大数据集群技术的概述 让我们从有趣的 "啤酒与尿布" 故事说起,在美国沃尔玛连锁超市,人们发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品居然摆在一起,但这一奇怪的举措居然使尿布和啤酒的销量大幅增加了.这并非一个笑话,而是一个真实案例. 原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒.这个发现为商家带来了大量的利润,但是如何从浩如烟海却又杂乱无章的数据中,发现啤酒和尿布这个看似不相干的

社会化数据时代的八爪鱼式生存

企业能否从移动互联网.物联网等网络中不断出现的数据源那里顺利发现并拿到它需要的数据? 作者:张承东 在Web页面中增加一个简单的 意见按钮,会不会让读者放弃填写文字评论?同样是给注册用户发送邮件通知,是纯文字版本.还是图形化版本获得的回复率更高呢? 这是Facebook曾经面临的无数个用户体验问题中的两个.要回答这类问题,最好的办法只有一个,就是实际测试一下. Facebook的确这么做了.他们分别选取了两组用户设计了一次测试.结果证明,增加了意见按钮后的评论增加了近5%:简单的基于文本的电子邮

电子商务就是建立人、物的有效连接

微信说的目的是帮助人们更好的链接,电子商务则也是帮助人和商品之间进行更好的有效连接,我们有很多好商品或适合用户的商品待在角落而没有被发现,错过了一些交易,考虑如何让商品更多的曝光在用户的面前. 线下零售已经发展了百年以上,观察线下来指导线上是有效的一种方式,常见的有这三种链接: 1. 最近有些商品你应该看看(人->物) 利用人们喜新.贪便宜和从众的心理,把新品摆在门口或放在橱窗,把促销的堆头放在过道,或告诉你这个季节那些买的很多,目的就是告诉你这些你应该看看.这样就把人和没有直接相关的商品建立了