吴军:你做的那些坏事,大数据全知道

2010年,美国各大媒体报道了这样一则新闻:

在南卡罗来纳州的多切斯特县,警察通过智能电表收集上来的各户用电情况分析,抓住了一个在家里种植大麻的人。

这件事引起了美国社会的广泛讨论:大数据能够如何帮助我们解决过去的难题,以及这项技术对未来社会会产生什么样的影响?

毒品问题是美国社会的一大毒瘤

到了大数据时代

私自种植毒品者的好日子就快到头了

问题描述:毒品问题一直是美国社会的一大毒瘤

过去美国政府一直把缉毒重点放在切断来自南美洲的毒品供应上,但仍然无法完全禁止毒品泛滥。其中一个很重要的原因就是,提炼毒品所需要的大麻,种植起来非常容易,甚至可以自己在家种植。美国马兰州巴尔第摩市当地的一些穷人把房屋的门窗钉死后,在里面偷偷用LED灯种植大麻,因偏僻荒弃,这里很快成了毒品种植者的天堂。在环境优美,生活水准高的西雅图地区同样发生了这样的情况。

在西雅图把门窗钉起来种毒品自然是行不通的,但是毒品种植者也有办法。有一家人花了50万美元,买下了一栋周围种满了玫瑰花的豪宅。这栋四卧两厅的大宅子其实没有人住,占据里面的是658株盆栽大麻。房主每年卖大麻的收入,不仅足够付房子的分期付款和电费,而且还让他攒够了首付又买了一栋房子。

类似的情况在美国、加拿大均有发生。

据估计,仅加拿大的不列颠哥伦比亚省,每年这种盆栽大麻的收入就高达65亿美元,在当地是仅次于石油的第二大生意。

是否对这一类街区进行重点排查是否就能解决问题呢?

答案并不如我们想象的那么简单。

由于种植毒品的人分布的地域非常广,而且做事隐秘,定位这样种植毒品的房屋的成本非常高。

再加上美国宪法的第四修正案规定“人人具有保障人身、住所、文件及财物的安全,不受无理之搜查和扣押的权利”,警察在没有证据时不得随便进入这些房屋进行搜查。

因此,过去警察虽然知道一些嫌犯可能在种植毒品,也只能望洋兴叹,这使得美国的毒品屡禁不止。

但是到了大数据时代,私自种植毒品者的好日子就快到头了。

截至2011年,仅俄亥俄一个州,警察就用类似的方法抓到了60个这样的大麻种植犯罪嫌疑人。

大数据是如何帮助警察提高定位效率的呢?

过去,供电公司使用的是老式电表,只能记录每家每月的用电量。但是从十几年前开始,智能电表的普及,不仅能够记录用电量,还能够记录用电模式。

因LED灯需日夜开启,种植大麻的房子用电模式和一般居家是不同的,只要把每家每户的用电模式和一般居家用电模式进行对比,就能很容易地圈定出一些犯罪嫌疑人。

在这个美国警察查处毒品种植的案例,我们看到了大数据思维的三个亮点:

  • 第一是,用统计规律和个案对比,做到精准定位。
  • 第二是,社会其实已经默认了在取证时,利用相关性代替直接证据,即我们大数据思维所说的,强相关性代替因果关系
  • 第三是,由于采取了机器,执法的成本,或者更广泛地讲,运营的成本,在大数据时代会大幅下降。

 

美国一半小型企业(包括餐馆等)

寿命不超过5年

大数据如何帮忙?

大数据在商业活动中从细节到整体,再从整体到细节双向的流动,使得我们不仅能够利用大数据对商业进行整体提升,更能够精确到每一个细节。

这在互联网公司已经不是什么稀奇事,不过即使在所谓的传统行业里,大数据也能帮助我们做到这一点。

我们不妨看看下面的例子。

戴维是硅谷地区一位创业者,他喜欢根据技术发展的大趋势寻找特定领域里的商机。

问题描述:美国一半小型企业(包括餐馆等)寿命不超过5年,酒吧也是如此。

戴维在一年里走访了美国100多家酒吧,发现它们之所以经营不下去,除了一般所说的经营不善,更重要的是大约23%的酒都被酒保们偷喝了。

那么酒保们是如何偷喝掉将近1/4 的酒的呢?

这其实很简单:

主要是酒保们趁老板不在的时候偷喝酒,或者给熟人朋友免费的和超量的酒饮。比如小王是酒保,小李是他的朋友。这天小李来到酒吧时,小王看老板不在,就给小李倒上一杯没有算钱。甚至即使老板在,小王本来该给小李倒4两酒,结果倒了6两。

由于每一次交易的损失都非常小,不易察觉,因此在过去酒吧的老板必须盯紧一些,如果有事离开一些,只好认倒霉。

开过小餐馆的人都会有这样的经验,自己是否在店里看着,对营业额的影响特別大,因此做这种餐饮买卖的人特别辛苦,稍微不注意就开始亏损。


针对酒吧老板的这些麻烦,戴维设计了一套解决方案。

改造酒吧的酒架,装上可以测置重置的传感器,以及无源的射频识别芯片(RFID) 的读写器,然后再在每个酒瓶上贴上一个RFID的芯片。

这样,哪一瓶酒在什么时候被动过,倾倒了多少酒都会被记录下来,并且和每一笔交易匹配上。

酒吧的老板即使出门办事,也可以了解酒吧经营的每一个细节。

当然,戴维提供的服务如果只是停留在这个层面,那么更像是一个“万物联网”(Internet of Things,简称 loT)的应用,与我们所说的大数据其实关系并不大。


戴维对酒吧的改造带来了一个额外的好处,就是积累了不同酒吧比较长时间的经营数据。

在这些数据的基础上,他为酒吧的主人提供了一些简单的数据分析。我把他提供的服务概括为以下三个方面:


  • 首先,分析每一家酒吧过去经营情况的统计数据,有助于酒吧主人全面了解经营情况。

在过去,像酒吧这样传统的行业,业主除了知道每月收入多少钱,主要几项开销是多少,其实对经营是缺乏全面了解的。

至于哪种酒卖得好,哪种卖得不好,什么时候卖得好,全凭经验和自己是否上心,没有什么分析。

戴维提供的数据分析让这些酒吧老板首先对自己的酒吧有了准确的了解。

 

  • 其次,为每一家酒吧的异常情况提供预警。

比如戴维可以提示酒吧老板某一天该酒吧的经营情况和平时相比很反常,这样就可以引起酒吧老板的注意,找到原因。

在过去,发生这种异常情况时老板很难注意到,比如某个周五晚上的收入比前后几个周五晚上少了20%,老板们一般会认为是正常浮动,也无法去一一检查库存是否和销售对得上。

有了戴维提供的数据服务,这些问题都能及时被发现。

  • 最后,综合各家酒吧数据的收集和分析,戴维会为酒吧老板们提供这个行业宏观的数据作为参考。

比如从春天到夏天,旧金山市酒吧营业额整体在上升,如果某个特定酒吧的销售额没有增长,那么说明它可能有问题。

再比如,戴维还可以提供不同酒的销售变化趋势,比如从春天到夏天,啤酒的销置上升比葡萄酒快,而烈酒的销售平缓等。

这些都能够帮助酒吧老板们改善经営。

原文发布时间为:2017-02-11

时间: 2024-08-16 15:03:11

吴军:你做的那些坏事,大数据全知道的相关文章

无论你做了好事还是坏事,大数据全知道

现在,我们可能不得不面对这样的现实:无论你是偷偷在家里种大麻,还是偷喝了老板的好酒,别人都会知道,因为有了大数据.一起来听听吴军博士讲的两个大数据的有趣故事. 2010年,美国各大媒体报道了这样一则新闻: 在南卡罗来纳州的多切斯特县,警察通过智能电表收集上来的各户用电情况分析,抓住了一个在家里种植大麻的人. 这件事引起了美国社会的广泛讨论:大数据能够如何帮助我们解决过去的难题,以及这项技术对未来社会会产生什么样的影响? 毒品问题是美国社会的一大毒瘤 到了大数据时代 私自种植毒品者的好日子就快到头

大数据全栈式开发语言 – Python

前 段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做"Fullstack JavaScript",是关于用JavaScript进行前端.服务器端,甚至数据库(MongoDB)开发,一个Web应用开发人员,只需要学会一门 语言,就可以实现整个应用. 受此启发,我发现Python可以称为大数据全栈式开发语言.因为Python在云基础设施,DevOps,大数据处理等领域都是炙手可热的语言. 领域 流行语言 云基础设施 Python, Java, Go DevOps

大数据全流程平台在互联网金融的实现

本文讲的是大数据全流程平台在互联网金融的实现, 如果有这么一家公司,它把数据视为它的生命线,那么它对数据系统一定有非常非常多的需求,它可能会要求它们的数据系统足够灵活,可以非常方便的加减数据源,它可能需要实时查询裸数据,也有可能对这个数据进行各种各样的计算,它还有可能去提高每次访问的实时性,同时也有可能提高批量离线分析时的性能以及水平扩展能力,如果你是一个架构师,你会怎样设计这套系统呢? 大家下午好,我是来自宜信的侯松,我今天分享的主题是<大数据全流程平台在互联网金融场景下的实现和借鉴意义>,

我为什么说 Python 是大数据全栈式开发语言

前段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做"Fullstack JavaScript",是关于用JavaScript进行前端.服务器端,甚至数据库(MongoDB)开发,一个Web应用开发人员,只需要学会一门语言,就可以实现整个应用. 受此启发,我发现Python可以称为大数据全栈式开发语言.因为Python在云基础设施,DevOps,大数据处理等领域都是炙手可热的语言. 领域 流行语言 云基础设施 Python, Java, Go DevOps P

说说这些年做的云计算和大数据项目

         入行十几年了,做了不少分布计算.并行计算.内存计算.海量数据处理的项目,按照现在的分类,这些都属于云计算/大数据范畴.今天说说我做过的其中三个项目,只三个.          第 一个是我们接到的视频分享网站的视频转码的订单,网站名字就不说了,有替人宣传嫌疑.他们情况是这样,视频网站的内容用MP4格式在网页上播放,但是上传 的格式多种多样,我们必须把这些视频统一转换成MP4格式,视频转码的工作想必大家都在自己的电脑上试过,通常一个100M左右的视频转码需要20分钟以 上(CPU

纯干货!如何做一个成功的大数据项目

1.失败大数据项目的特征 根据在美国做了15年的大数据项目.产品研发和管理,以及其它一些相关的数据分析的工作经验,了解到的其它的做的比较成功的和失败的项目,跟大家做一个经验分享.基本上大数据项目失败的特征主要是五个: 一是大数据项目与企业战略脱节,完全是领导或者是不知道那个部门的决策人突然脑子一热,就说别人在用,我们也做一个,根本没有把该做的项目和企业的商业战略.科技战略等各个方面结合起来.在项目无法与战略协调,无法在战略的指导下做一款产品或者是服务项目的时候,失败的可能性会非常大. 二是大数据

做精准营销把握大数据机遇

社交网络营销的概念渐近普及.在国外,Facebook开创了网络营销新的市场格局, 社交平台在网络营销中占据了越来越显著的位置.社交网络广告将带来哪些好处?在国内,应该如何利用社交平台优化营销效果?记者近日就这些问题,于钓鱼台国宾馆互联网产业年会之际,访问了腾讯开放平台总经理林松涛先生. 林松涛先生说:"在广告行业里面,有一句很经典的话是我知道有一半的广告费是被浪费的,但是我不知道是哪一半.而随着大数据时代的到来,精准衡量广告效果将成为可能." 早期营销中,由于信息不对称,广告主选择广告

国金证券资管投资总监石兵:做不一样的大数据基金

随着券商资管业务版图步入红海,差异化竞争成为业内共识.近年来,量化对冲投资在国内异军突起,不少机构将其作为新的投资方向. 国金证券资管分公司自成立之初即将产品线定位为量化对冲投资,成立的3年时间里,主动管理型产品无论是品种.数量还是规模均实现了质的飞跃.如今,国金资管在量化的道路上继续深挖,开始探索运用大数据技术来辅助投资. 数据显示,截至2016年1月5日,在市场130只量化对冲相对价值策略产品中,国金资管有7只产品2015年业绩跻身前25名,第一名就是国金慧泉精选对冲3号. 布局量化期待厚积

大数据全真案例带你来解密如何挑选“风水宝地”

几年前有一首叫做<风生水起>的歌,小小地火过一阵子,如今如日中天的麦玲玲风水运程大师,被农夫组合直接唱到歌词里,虽有几分戏谑,但确实借由此歌走进大众视野-- 风生水起 农夫组合 玲玲出嚟又睇掌喇 睇掌睇掌睇相 急急如律令 一命二运三风水 究竟点解 佢出世嗰时含住条金锁匙 究竟为什么 他出生的时候就含着金钥匙 又点解 我成间屋仲细过佢个坐厕 又为什么 我整间屋子比他的坐厕还要小 又点解 我次次买六合彩时中得一个字 又为什么 我每次买六合彩只中一个字 都说投胎是个技术活,为什么有人含着金汤匙天生的