大数据5件能做和不能做的事

引言

“大数据让我们变得更智能,而不是更聪明。”– Tim Leberecht

“大数据”一词早在20世纪40年代就出现了。全世界的公司都在竭尽全力地探索它的潜力。全球的科技巨头们都在大幅增加大数据技术的支出。这种趋势在主要行业的竞争者间还在加剧。

结果,根据调查公司IDC的预测, 大数据技术及服务直到2019年将以每年23%的速度增长.2019年在大数据上的支出将达到486亿美元。

这就是为啥大数据正在被全世界人们接受的原因。

公司从大数据身上看到了一线生机,让他们可以利用任何大小的数据。智能手机、GPS、传感器等在收集数据方面都发挥着作用。每一比特的数据都被收集起来然后处理成对我们(客户)有价值的信息。

在大数据不断给人们带来效益的时候,人们没有看到它 “不能” 做的事情, 也让我感到惊讶。但是我很快意识到,大数据不断的补充我们的商业直觉却绝不会成为替代品。

在本文中,我将过去7天的调查呈现给各位。我强烈的好奇心驱使我这样做。大数据对一个公司成功是至关重要的事实让我无法理解。大数据能胜任很多事情,但也有很多事情无能为力。

注意:我的想法并无完全,只是给各位提供一个思路。随便将你的想法留言在评论区中吧。

“大”数据的”小”练习

这个练习将为我们的将来做好准备。我们必须清楚要发生的事情还在后头。如果你在阅读这里,我请你考虑这样一个问题,你只需要写出(我已经共享了答案):

比如,如果我使用与大数据相关的平台得出这样一个逻辑结论,X是不可能的。我将排除与X有关的所有业务问题,能明白吗?

以下就是我的一个清单。如果你不同意下列中的观点,那么请证明一下吧!我会很乐意即使修改我的清单。让我们用一些商业直觉和分析的注解来开始解释我的一些思想。

80:20法则

这个法则说的是

“花80%的时间从过去的数据创建故事,20%的时间花在用现在的商业把这些故事串联起来”

说明:我相信没有跟商业直觉联系起来的分析见解都是没有用的。同意么?而且,  随着时间的流逝,以数据为驱动的部分在成指数级增长。 公司正在被数据的洪流所淹没。但这真的有用吗?不!

公司必须意识到,正确的将成功的商业分析与需要的商业视觉的比例是80:20。

如果我们建立一个故事用80%的时间分析过去的信息以求得对未来的预期,我们需要投入20%的时间思考这些信息对我们的业务有没有帮助。我们必须想到一些可以改变我们的将来和满足更广泛的业务目标的方法。这需要很强的商业理解力和良好的业务规则的知识。

这条法则中20%的成分是无可替代的。因此,人类的介入是为了解决这20%的问题,机器是不能满足的。即使是人工智能也不行。因为,人类的创造力是在无拘束的思考中诞生的。我相信创造力是机器无法带给我们的。我的清单正是受到了这个法则的启发。

5件大数据可以做到的事情

1.诊断分析 :我们每天都在做这个事情。机器更擅长做这个。当一个事件发生的时候,我们发现对寻找起因感兴趣。比如,设想在沙漠A挂起了沙暴,我们有沙漠A地区的各种参数:温度,气压,骆驼,道路,汽车等等。如果我们能将这些参数跟该地区的沙暴联系起来,如果我们知道一些因果关系,我们可能就会避免沙暴。想象下大数据的威力。

2.预测分析 :我们经常做这个事情。预测分析是根植在我们的DNA里的。比如,我们在全球有一个酒店连锁。现在我们需要找出那些酒店是没有达到销售目标的。如果我们知道的话我们就可以将努力集中在他们身上。这成为了预测分析的经典问题。

3.在未知元素间寻找关联 :我喜欢这部分分析。比方说销售雇员的数量跟销售额真的没有关系吗。你可能会减少一些雇员来看看是否真的对销售额没有损失。

4.规范的分析 :这是分析学的未来。比如说我们尝试着预测一个在大众目标的恐怖袭击然后安全的将人们转移的策略。做出这个预测,你需要做出在那个时候那个地点的游客人数,可能会被爆炸所影响到的地区等各种预测。

5.监控发生的事件 :行业中的大部分人都在做监控事件的工作。比如,你需要检测一个活动的反馈找到强烈和不强烈的部分。这些分析成为运营一个企业的关键

5件大数据不可以做到的事情

1.预测一个确定的未来 :使用机器学习的工具我们可以达到90%的精度。但是我们无法达到100%的准确。如果我们可以做到的话,我可以确切的告诉你谁才是目标以及每一次100%的响应率。但可惜的是这绝不会发生。

2.归咎于新的数据源 :在任何分析上,归责耗费了大部分时间。我相信这就是你的创造力和商业理解的来源。可能的是,你无法摆脱在你的分析中最无聊的部分。

3.找到一个商业问题的创新的解决方案 :创造力是人类永远的专利。没有机器可以找到问题的创新的解决方法。这是因为即使是人工智能也是由人们去编码的产物,创造力是不会从算法自己学习而来的。

4.找到定义不是很明确的问题的解决方法 :分析学最大的挑战就是从业务问题中形成一个分析问题模型。如果你能做得很好,你正在成为一个分析明星。这种角色是机器无法取代你的。比如,你的业务问题是管理损耗。除非你定义了响应者,时间窗口等,没有预测算法可以帮你。

5.数据管理/简化新数据源的数据 :随着数据量的增长,数据的管理正在成为一个难题。我们正在处理各种不同结构化的数据。比如,图表数据可能更适合网络分析但是对活动数据是没用的。这部分信息也是机器无法分析的。

最后

我相信这篇文章将发挥它的潜力如果你尝试了文章中的练习的话。试着从一个更全面的视角中思考,你会发现机器无法做到的事情。比如,我的初始点80:20法则指出机器将无法带来创造力。这个启发点帮我思考在分析的过程中那些部分是需要创造力的。

本文作者:佚名

来源:51CTO

时间: 2024-07-29 06:52:15

大数据5件能做和不能做的事的相关文章

上海市儿童医院院长:医疗大数据的价值、难点和我们做了什么?

雷锋网(公众号:雷锋网)消息,近日,由HC3i中国数字医疗网.中关村移动互联网产业联盟移动医疗专委会主办的<2017中美智能医疗大数据峰会>在北京召开,上海市儿童医院院长于广军出席并发表演讲. 他认为,大数据不仅能助于科研,还可以为服务模式和管理模式的转变提供支撑.会上,他分享了上海市利用医疗大数据技术改革医疗管理的实践. 医疗大数据的价值和难点 于广军院长称,医疗大数据的发展与医疗信息化紧密相关.医疗信息化经历3个阶段,由财务结算信息化.临床为中心单点信息化到以区域为中心的信息化."

马云:大数据时代,最重要的是做最好的自己

做个二十名的人其实蛮好的.大数据时代,最重要的是让每个人做最好的自己. 6月29日上午,天津"世界智能大会"现场,马云作了万字演讲,以下是马云演讲整理: 我今天不是为不同而不同,我觉得进入数据时代,一个很重要的事,每个人对每个问题的看法.角度.深度和广度必须是不一样的,只有不一样,你才是你.其实大数据时代,最重要的是让每个人做最好的自己. 我最近一直在讲,我说我念高中,从小到达,没有考试当过第一名,一个很重要的原因,我知道我当不了第一名.第二,当第一名太累.第三,第一名只有一个,一个班

英特尔让大数据“接地气”:Hadoop从架构做起

当大数据成为常挂在口边的一个词,那么,接地气就显得尤为重要.英特尔将大数据解决方案英特尔Hadoop发行版软件最先发布在中国,并在通信等行业得以实施,更要紧的是,英特尔为ISV.应用软件供应商在大数据上的实施带来了便捷. 中国是大数据的最佳实践地 由于中国市场容量大,所以,大数据在中国有非常好的发展环境.英特尔在大数据领域的探索,中国区处在全球的前列.去年,英特尔在中国就已经有一些典型的案例实施,去年三季度在国内发布了大数据解决方案英特尔Hadoop发行版软件,全球市场直到今年2月才发布,已经领

专家谈零售大数据:以前没想到能做的现在可以做了

国内第一代大数据创业家柏林森先生是国内大数据技术和实践的先驱,先后创立百分点科技.信柏科技两家大数据公司,是中关村高端领军人才.海淀区创业领军人才.中关村十大海归新星.现在柏林森先生正领导"信柏科技"致力于"用消费大数据来帮助线下零售业O2O转型"的事业,零售行业内大数据标杆性项目--朝阳大悦城大数据体系系统就是由柏林森先生领导的大数据团队助力而完美落地的. 在最近的亚太零售创新峰会2014上,柏林森先生发表了关于"零售大数据"的独特又深刻的演讲

大数据能做什么

Hadoop和大数据是这两年最火的词儿们之一,越来越多的公司对这个东西感兴趣,但是我接触到的大多数公司里的人,无论是技术人员还是老板.都不知道怎么能把这些东西用于改善自己公司的业务.在解答的过程中,提炼出几个要点,记录一下.   大数据和云是不是一回事? 这是最容易混淆的概念之一,我个人认为这是两回事,云服务,无论是云主机还是云存储还是云的其他应用,都是向用户提供一个接口,但这个接口的后端是虚拟机技术,或者分布式存储技术,或者其他分布式计算技术等等.简而言之,云的概念就是我向你提供服务,而你不需

做大数据不能蜻蜓点水

摘要:从大数据兴起后,我们听到了很多关于大数据的故事,但是好像永远也就那几个.电子商务领域的成功案例,都是与搜索.推荐和精准营销相关,我们希望听到的更多. "我现在脑海里大概有20多个idea,就是利用大数据分析去解决各种各样的业务问题."在回答ZDNet记者关于数据分析如何支撑业务的问题时,去哪儿网机票事业部数据营销高级经理吴君如此回答到. 关于大数据在电子商务领域的应用场景,我们听到最多的就是那个少女怀孕的故事.这些案例更多地是围绕电子商务企业如何利用大数据分析做好推荐.搜索,做精

建首个国家大数据综合试验区 贵州怎么做?

两会期间,国家"十三五"计划实施的100个重大工程及项目备受关注,贵州大数据综合试验区建设位列其中,这也是全国首个获批建设的国家级大数据综合试验区.发展大数据,贵州有着什么优势?做了哪些准备? 贵州大数据朋友圈越来越大 "大数据既要高大上,也要接地气."在十二届全国人大四次会议贵州代表团开放日上,贵州省委书记陈敏尔强调,大数据是一个产业,可以创造很多产品和服务,既有大数据的积聚.整理.处理等,涉及高端技术.创新商业模式等,也包括农村电商和呼叫服务,这类产业既能广泛吸

院士演讲:大数据时代的位置服务

 摘要: 中国工程院院士李德毅院士为大家带来<大数据时代的位置服务>的主题演讲,李德毅院士同时指出:大数据引发新理念,实践中的研究也许胜过研究中的实践,较多的数据也许胜过较好的算法  以"智慧城市与移动信息化"为主题的"第七届中国电子政务高峰论坛"于2013年6月23日在北京大学英杰交流中心阳光大厅隆重举办.本次论坛由工业和信息化部信息化推进司指导,北京大学信息化与信息管理研究中心主办,中央机构编制委员会办公室电子政务中心.北大CIO班教务办公室协办,C

湘雅医院黄伟红教授:希望AI专家多来医院讲课,把大数据思维渗到各个医疗环节

"我们不能只把大数据当做技术活儿,更应该让它形成一种文化.让更多老师和专家进入到医院里讲课,把大数据思维渗透到临床一线.科研一线,渗透到管理者的大脑里去." 在提及大数据和AI对医院的好处时,黄伟红如此说道. 黄伟红现为中南大学湘雅医院"移动医疗"教育部-中国移动联合实验室副主任,该实验室是教育部唯一一个设在医院里的医疗信息化实验室. 雷锋网了解到,实验室成立的目的,主要是为探索交叉学科如何走向科研和技术前沿,以及成果转化. 医院做AI,人最重要,技术次之 黄伟红首