无论你做了好事还是坏事,大数据全知道

现在,我们可能不得不面对这样的现实:无论你是偷偷在家里种大麻,还是偷喝了老板的好酒,别人都会知道,因为有了大数据。一起来听听吴军博士讲的两个大数据的有趣故事。

2010年,美国各大媒体报道了这样一则新闻:

在南卡罗来纳州的多切斯特县,警察通过智能电表收集上来的各户用电情况分析,抓住了一个在家里种植大麻的人。

这件事引起了美国社会的广泛讨论:大数据能够如何帮助我们解决过去的难题,以及这项技术对未来社会会产生什么样的影响?

毒品问题是美国社会的一大毒瘤

到了大数据时代

私自种植毒品者的好日子就快到头了

问题描述:毒品问题一直是美国社会的一大毒瘤

过去美国政府一直把缉毒重点放在切断来自南美洲的毒品供应上,但仍然无法完全禁止毒品泛滥。

其中一个很重要的原因就是,提炼毒品所需要的大麻,种植起来非常容易,甚至可以自己在家种植。

美国马兰州巴尔第摩市当地的一些穷人把房屋的门窗钉死后,在里面偷偷用LED灯种植大麻,因偏僻荒弃,这里很快成了毒品种植者的天堂。

在环境优美,生活水准高的西雅图地区同样发生了这样的情况。

在西雅图把门窗钉起来种毒品自然是行不通的,但是毒品种植者也有办法。

有一家人花了50万美元,买下了一栋周围种满了玫瑰花的豪宅。这栋四卧两厅的大宅子其实没有人住,占据里面的是658株盆栽大麻。

房主每年卖大麻的收入,不仅足够付房子的分期付款和电费,而且还让他攒够了首付又买了一栋房子。

类似的情况在美国、加拿大均有发生。

据估计,仅加拿大的不列颠哥伦比亚省,每年这种盆栽大麻的收入就高达65亿美元,在当地是仅次于石油的第二大生意。

是否对这一类街区进行重点排查是否就能解决问题呢?

答案并不如我们想象的那么简单。

由于种植毒品的人分布的地域非常广,而且做事隐秘,定位这样种植毒品的房屋的成本非常高。

再加上美国宪法的第四修正案规定“人人具有保障人身、住所、文件及财物的安全,不受无理之搜查和扣押的权利”,警察在没有证据时不得随便进入这些房屋进行搜查。

因此,过去警察虽然知道一些嫌犯可能在种植毒品,也只能望洋兴叹,这使得美国的毒品屡禁不止。

但是到了大数据时代,私自种植毒品者的好日子就快到头了。

截至2011年,仅俄亥俄一个州,警察就用类似的方法抓到了60个这样的大麻种植犯罪嫌疑人。

大数据是如何帮助警察提高定位效率的呢?

过去,供电公司使用的是老式电表,只能记录每家每月的用电量。但是从十几年前开始,智能电表的普及,不仅能够记录用电量,还能够记录用电模式。

因LED灯需日夜开启,种植大麻的房子用电模式和一般居家是不同的,只要把每家每户的用电模式和一般居家用电模式进行对比,就能很容易地圈定出一些犯罪嫌疑人。

在这个美国警察查处毒品种植的案例,我们看到了大数据思维的三个亮点:

第一是,用统计规律和个案对比,做到精准定位。

第二是,社会其实已经默认了在取证时,利用相关性代替直接证据,即我们大数据思维所说的,强相关性代替因果关系。

第三是,由于采取了机器,执法的成本,或者更广泛地讲,运营的成本,在大数据时代会大幅下降。

美国一半小型企业(包括餐馆等)

寿命不超过5年

大数据如何帮忙?

大数据在商业活动中从细节到整体,再从整体到细节双向的流动,使得我们不仅能够利用大数据对商业进行整体提升,更能够精确到每一个细节。

这在互联网公司已经不是什么稀奇事,不过即使在所谓的传统行业里,大数据也能帮助我们做到这一点。

我们不妨看看下面的例子。

戴维是硅谷地区一位创业者,他喜欢根据技术发展的大趋势寻找特定领域里的商机。

问题描述:美国一半小型企业(包括餐馆等)寿命不超过5年,酒吧也是如此。

戴维在一年里走访了美国100多家酒吧,发现它们之所以经营不下去,除了一般所说的经营不善,更重要的是大约23%的酒都被酒保们偷喝了。

那么酒保们是如何偷喝掉将近1/4 的酒的呢?

这其实很简单:

主要是酒保们趁老板不在的时候偷喝酒,或者给熟人朋友免费的和超量的酒饮。

比如小王是酒保,小李是他的朋友。

这天小李来到酒吧时,小王看老板不在,就给小李倒上一杯没有算钱。甚至即使老板在,小王本来该给小李倒4两酒,结果倒了6两。

由于每一次交易的损失都非常小,不易察觉,因此在过去酒吧的老板必须盯紧一些,如果有事离开一些,只好认倒霉。

开过小餐馆的人都会有这样的经验,自己是否在店里看着,对营业额的影响特別大,因此做这种餐饮买卖的人特别辛苦,稍微不注意就开始亏损。

针对酒吧老板的这些麻烦,戴维设计了一套解决方案。

改造酒吧的酒架,装上可以测置重置的传感器,以及无源的射频识别芯片(RFID) 的读写器,然后再在每个酒瓶上贴上一个RFID的芯片。

这样,哪一瓶酒在什么时候被动过,倾倒了多少酒都会被记录下来,并且和每一笔交易匹配上。

酒吧的老板即使出门办事,也可以了解酒吧经营的每一个细节。

当然,戴维提供的服务如果只是停留在这个层面,那么更像是一个“万物联网”(Internet of Things,简称 loT)的应用,与我们所说的大数据其实关系并不大。

戴维对酒吧的改造带来了一个额外的好处,就是积累了不同酒吧比较长时间的经营数据。

在这些数据的基础上,他为酒吧的主人提供了一些简单的数据分析。我把他提供的服务概括为以下三个方面:

首先,分析每一家酒吧过去经营情况的统计数据,有助于酒吧主人全面了解经营情况。

在过去,像酒吧这样传统的行业,业主除了知道每月收入多少钱,主要几项开销是多少,其实对经营是缺乏全面了解的。

至于哪种酒卖得好,哪种卖得不好,什么时候卖得好,全凭经验和自己是否上心,没有什么分析。

戴维提供的数据分析让这些酒吧老板首先对自己的酒吧有了准确的了解。

其次,为每一家酒吧的异常情况提供预警。

比如戴维可以提示酒吧老板某一天该酒吧的经营情况和平时相比很反常,这样就可以引起酒吧老板的注意,找到原因。

在过去,发生这种异常情况时老板很难注意到,比如某个周五晚上的收入比前后几个周五晚上少了20%,老板们一般会认为是正常浮动,也无法去一一检查库存是否和销售对得上。

有了戴维提供的数据服务,这些问题都能及时被发现。

最后,综合各家酒吧数据的收集和分析,戴维会为酒吧老板们提供这个行业宏观的数据作为参考。

比如从春天到夏天,旧金山市酒吧营业额整体在上升,如果某个特定酒吧的销售额没有增长,那么说明它可能有问题。

再比如,戴维还可以提供不同酒的销售变化趋势,比如从春天到夏天,啤酒的销置上升比葡萄酒快,而烈酒的销售平缓等。

这些都能够帮助酒吧老板们改善经营。

本文转自d1net(转载)

时间: 2024-09-21 09:34:08

无论你做了好事还是坏事,大数据全知道的相关文章

大数据全栈式开发语言 – Python

前 段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做"Fullstack JavaScript",是关于用JavaScript进行前端.服务器端,甚至数据库(MongoDB)开发,一个Web应用开发人员,只需要学会一门 语言,就可以实现整个应用. 受此启发,我发现Python可以称为大数据全栈式开发语言.因为Python在云基础设施,DevOps,大数据处理等领域都是炙手可热的语言. 领域 流行语言 云基础设施 Python, Java, Go DevOps

大数据全流程平台在互联网金融的实现

本文讲的是大数据全流程平台在互联网金融的实现, 如果有这么一家公司,它把数据视为它的生命线,那么它对数据系统一定有非常非常多的需求,它可能会要求它们的数据系统足够灵活,可以非常方便的加减数据源,它可能需要实时查询裸数据,也有可能对这个数据进行各种各样的计算,它还有可能去提高每次访问的实时性,同时也有可能提高批量离线分析时的性能以及水平扩展能力,如果你是一个架构师,你会怎样设计这套系统呢? 大家下午好,我是来自宜信的侯松,我今天分享的主题是<大数据全流程平台在互联网金融场景下的实现和借鉴意义>,

我为什么说 Python 是大数据全栈式开发语言

前段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做"Fullstack JavaScript",是关于用JavaScript进行前端.服务器端,甚至数据库(MongoDB)开发,一个Web应用开发人员,只需要学会一门语言,就可以实现整个应用. 受此启发,我发现Python可以称为大数据全栈式开发语言.因为Python在云基础设施,DevOps,大数据处理等领域都是炙手可热的语言. 领域 流行语言 云基础设施 Python, Java, Go DevOps P

吴军:你做的那些坏事,大数据全知道

2010年,美国各大媒体报道了这样一则新闻: 在南卡罗来纳州的多切斯特县,警察通过智能电表收集上来的各户用电情况分析,抓住了一个在家里种植大麻的人. 这件事引起了美国社会的广泛讨论:大数据能够如何帮助我们解决过去的难题,以及这项技术对未来社会会产生什么样的影响? 毒品问题是美国社会的一大毒瘤 到了大数据时代 私自种植毒品者的好日子就快到头了 问题描述:毒品问题一直是美国社会的一大毒瘤 过去美国政府一直把缉毒重点放在切断来自南美洲的毒品供应上,但仍然无法完全禁止毒品泛滥.其中一个很重要的原因就是,

阿里巨资贷款做收购,隐性布局大数据

马云卸任CEO之前的一周,阿里巴巴集团(以下简称阿里巴巴)与9家银行签署了80亿美元的融资贷款.这是继去年4笔总额为40亿美元的贷款后,阿里巴巴进行的又一次巨额融资. 昨日(5月22日),路透社曝光了阿里巴巴80亿美元贷款的细节.<每日经济新闻>记者注意到,这笔贷款主要用于移动互联网行业的投资并购,从其商业逻辑中不难发现,阿里巴巴在投资移动互联网的同时,还隐藏着马云对大数据的隐性布局. 贷款年限不超5年/ <每日经济新闻>记者了解到,此次为阿里巴巴提供贷款的银行均为海外金融巨头,包

大数据全真案例带你来解密如何挑选“风水宝地”

几年前有一首叫做<风生水起>的歌,小小地火过一阵子,如今如日中天的麦玲玲风水运程大师,被农夫组合直接唱到歌词里,虽有几分戏谑,但确实借由此歌走进大众视野-- 风生水起 农夫组合 玲玲出嚟又睇掌喇 睇掌睇掌睇相 急急如律令 一命二运三风水 究竟点解 佢出世嗰时含住条金锁匙 究竟为什么 他出生的时候就含着金钥匙 又点解 我成间屋仲细过佢个坐厕 又为什么 我整间屋子比他的坐厕还要小 又点解 我次次买六合彩时中得一个字 又为什么 我每次买六合彩只中一个字 都说投胎是个技术活,为什么有人含着金汤匙天生的

专家谈零售大数据:以前没想到能做的现在可以做了

国内第一代大数据创业家柏林森先生是国内大数据技术和实践的先驱,先后创立百分点科技.信柏科技两家大数据公司,是中关村高端领军人才.海淀区创业领军人才.中关村十大海归新星.现在柏林森先生正领导"信柏科技"致力于"用消费大数据来帮助线下零售业O2O转型"的事业,零售行业内大数据标杆性项目--朝阳大悦城大数据体系系统就是由柏林森先生领导的大数据团队助力而完美落地的. 在最近的亚太零售创新峰会2014上,柏林森先生发表了关于"零售大数据"的独特又深刻的演讲

纯干货!如何做一个成功的大数据项目

1.失败大数据项目的特征 根据在美国做了15年的大数据项目.产品研发和管理,以及其它一些相关的数据分析的工作经验,了解到的其它的做的比较成功的和失败的项目,跟大家做一个经验分享.基本上大数据项目失败的特征主要是五个: 一是大数据项目与企业战略脱节,完全是领导或者是不知道那个部门的决策人突然脑子一热,就说别人在用,我们也做一个,根本没有把该做的项目和企业的商业战略.科技战略等各个方面结合起来.在项目无法与战略协调,无法在战略的指导下做一款产品或者是服务项目的时候,失败的可能性会非常大. 二是大数据

天天在做大数据,你的时间都花在哪了

前言 我每天都在思考,思考很重要,是一个消化和不断深入的过程. 正如下面的一句话: 我们从出生开始如果没思考过人生本身这件事情,一切按照社会的习惯前行,那人生是没有意义的.因为你连人生都没有想过. 那么延生出来,我们有没有想过大数据本身?大数据到底是在做什么,为什么我做了这么多年的大数据,总是做不完呢? 大数据本质是: 随着科学技术发展,更多的数据能够被存储了,能被分析了.所以有了大数据的概念. 机器学习的本质是: 随着数据变多了,量变导致质变,数据足够大后其内部的隐含的规律会越来越精确和完整.