你的大数据项目离失败有多远?

导读大数据项目的成功或许不可复制,但从失败中汲取教训同样很有意义。作者从本人实践项目入手,从商业目标、商业案例、项目管控、沟通、技能等角度分析其失败的原因。

过去六个月里,我发现大数据项目的总量正在以惊人的速度增长着,大多数与我合作过的公司都计划在接下来一年内,进一步拓展大数据项目的领域。其中,许多项目都被报以很高的期望,但大数据项目,远没有想象中那么简单。我认为,其中半数的大数据项目最终都无法达到他们的预期。

失败的原因是多方面的,许多显而易见的问题或者影响因素都会对大数据项目造成致命的打击,项目也会因此走向最终的失败。与许多不同规模形态的公司合作过后,我了解到这些危险因素其实是非常常见的。失败的项目往往有一个共通的原因 — 缺乏前期充分的项目规划。


根据我参与过的大数据商业化项目经验,在这里列举了几个我工作中最常见的失败原因(顺序不分先后)。

1缺乏明确的商业目标
Not starting with clear business objectives

人们很容易因炒作而盲目跟从,显然大数据已经被炒作了起来。许多人(包括我)正在叫嚷着大数据如何不可或缺,如何像诺亚方舟一样拯救世界,就好像其余的船只终将被大浪摧毁,只有大数据这艘诺亚方舟能驶向彼岸。由此看来,许多人跳过“为什么做”直接思考“如何做”也就不稀奇了。

登上大数据方舟的人们往往会忘记,商业化分析的核心在于解决现有问题,所以说在展开商业化大数据项目前要明确待解决的问题是什么。

我曾经与一家航空公司合作,该公司带着超级的热情投入一系列大数据项目中——从乘客的饮食偏好到航班延误对饮品销量的影响,不放过任何一个环节的信息采集和分类。

我的另一个客户是一家零售商,独立运行中的大数据项目多达258个!一些项目比较有趣,例如根据库存量及销售量进行数据挖掘,他们发现有一种酒在周二销量特别好,如果是下雨的话销量往往会更好。然而,知道这些又能解决什么问题呢?不可能因为周二一天的销量就打乱已经预先分配好的货架空间。最多也就是确保每周二进行常规性的补货,保证货架容纳空间饱和。只从这个案例看,这样的数据分析,并没有为客户提供长足的增长或积极的改变。

也许在众多的项目里,会侥幸有某一个有趣的数据分析维度解决了实际问题,但这样做其实是非常低效的。这就有点儿像考试的时候,答题的人根本不在乎题目到底问的是什么,只顾埋头写下这门课自己知道的所有内容,抱着侥幸心理希望其中能包含考官要的正确答案。

2没能塑造出成功的商业案例
Not making a good business case

许多人带着一种“大家做我也做”的心态去开展大数据业务,因此,这个领域的门槛也在不断地下降。这是一件好事,一方面,人们越来越容易地随时谁地获取开源软件。另一方面,越来越多的公司开发“服务型软件”(SaaS,software-as-a-service),极大地降低了基础设施的投资成本。再加上很多像我这样的人总是会说,这个行业如逆水行舟,不进则退,你不作为就会被别人横甩十八条街。这样一来,会有更多的人盲目地进入大数据行业。

这些都是真实现状,但要明确你的大数据项目为何而生,需要多少时间和资源。你需要确保收集来的大量数据,尤其是大数据,一定是干净安全的数据,否则你很可能需要在将来为这些不干净不安全的数据支付大量成本。简言之,在项目启动前,你要明确项目是不是真的需要大数据。如果你说不清道不明,那就请想明白再行动。


3项目管控失误
Management Failure


我承认,几乎任何失败项目都会在管控环节上存在问题,这是一个放之四海而皆准的项目失败原因。但我想强调的是,一位经验丰富的大数据科学家,年薪一般在10万美金以上;除了这部分投入,大数据项目还需要投入大量的时间和各种资源。这种情况下,管控失误会产生灾难性的后果。

有时候,攥着钱袋子的人并没有将项目相关的长期或持续性的费用纳入考虑。或者,有时候高级项目经理与在实验室里的数据科学家沟通成效不大。许多高级项目经理做到今天的位置全是凭直觉凭胆量,所以有时候高级管理经理们不会相信那些大数据的算法,他们不会试着让电脑去指挥他们做什么。

管控不善包含很多方面,最典型的案例就是NHS(英国国家医疗服务体系)的国家医疗信息化项目。这个项目计划将所有病人的电子病历录入到中央数据库中,项目总投入超过100亿英镑(约合972亿人民币,156亿美元),但随着项目的失败,最终被描述为“IT业内有史以来最大的败笔”。4沟通不畅
Poor communication

“大数据都让书呆子似的科学家和唯利是图的企业承包了”——这样说未免有失偏颇,对科学家们和各大企业都不公平。但是,这个说法可以用来体现沟通的重要性。商业化大数据是学术与金钱的产物,一方面是实验室内的分析性、实验性科学,另一方面是追求利润和业绩的销售团队以及董事会成员。这两者本就不是志同道合的伙伴,再加上信息在传递过程中难免会有缺失,这样的沟通不畅很可能会造成灾难性的后果。

在我看来,“挑战者号“航天飞机的灾难就是一个实例,虽然那个时候还没有大数据这个概念,但这个灾难依旧是可以避免的。当时NASA(美国国家航空航天局)的分析师在处理来自航天飞机上传感器的大量监测数据,在他们提供给地面控制中心的高层领导的报告中,充斥着大量的细节数据,这其中就包含很重要的坠毁的风险信息。如果地面控制中心能在繁冗的数据报告中发现这个风险信息,或者如果分析师们能把报告命名为“坠毁风险测评因素—高级别风险报告”这种重点突出的标题,事情可能会有一个不一样的结局。

但有时候吃一堑并没有长一智。负责撰写报告的人应该考虑到“这份数据的目标读者是谁,怎样包装才能保证信息的准确传达”。我曾为一家医疗公司做分析咨询,这家公司最近为高管层提供了一份长达217页的报告。我们最终将这份报告缩减到15页,用图表来代替大量文字,在不丢失信息的基础上还将报告以更加简洁的方式展示。

5缺乏工作中的必备技能
Not having the right skills for the job

或者更准确地说是,在必要时刻,缺乏必备技能。正如我之前对案例的阐释一样,在没有考虑清楚项目对资源未来影响的情况下,企业就直接启动大数据项目。经验丰富的数据科学家团队无疑是非常宝贵的资源。在我看来,没有明确目标盲目开始的项目,一般很难发现自身的问题,除非他们在恰当的时机得到了宝贵的项目分析意见,并且寻得经验丰富的员工加入团队。

物以希为贵,数据科学的从业者亦是如此。企业需要突破思维定式来解决这个问题。例如我的一个银行客户,他的团队中有许多商业分析师,既没受过大数据的相关培训,也不是数据科学家。我建议他给现有分析师进行定制化的大数据培训,因为商业分析与大数据这两个学科其实有很多技能交叉,这要比雇佣一个全新的专家团队要便宜得多。我们会在培训前鉴定出关键技能的区别,并为客户量身打造制定化的大数据课程,帮助商业分析师转变为大数据科学家。我们的课程还融合了许多的在线资源,这部分在线资源的课程可以为所有人免费提供必要的基础课程。除了培训之外,有些学院或大学还会提供学生和学术教授的人力资源,为企业提供商业化的分析。现今,银行也会为那些使用银行商务数据库做研究论文的博士生们提供相应的资助。

拓展阅读NHS项目失败简史
National Programme for IT 简称 NPfIT,即全英医护IT计划或国家医疗信息化项目。该计划于2002年开始实施,目标是实现患者医疗信息可在全国范围内进行共享,全面实现英国国家卫生服务系统(NHS)所有信息系统标准化,用10年时间为每一个英国公民建立“从生到死”的全生命周期电子病历系统。

整个NPfIT项目采用“集中式”技术架构,由5个集群构成,主要集成商为British TeleCom(英国电信)、Atos Origin(源讯公司)、Accenture(埃森哲)、CSC Alliance(CSC)、Fujitsu Alliance(富士通), 主要产品和技术提供商为CSW、IDX(已被GE收购)、Cerner、iSoft等,总合同额约为61.1亿英镑,堪称欧洲最大的计算机商业项目。

然而,该计划饱受争议。到2004年之后,该项目的一些问题逐渐暴露,设计者没有充分考虑医生的专业需求和医疗服务的多样性,新的系统并未带来新的功能,承诺的关键系统不能交付使用。到2006年时NPfIT项目已投资达130亿英镑, 大大超出了预算。此外,采用集中式IT 技术架构,不能适应不同医疗专业的服务要求,存在严重的性能和功能拓展问题。系统集成商和产品技术供应商不能兑现其合同承诺,设计的系统实用性差。最终导致失败,并被描述为“IT业内有史以来最大的败笔”。

原文发布时间为:2015-05-25

时间: 2024-10-28 03:36:19

你的大数据项目离失败有多远?的相关文章

何多数的大数据项目以失败告终?

几乎每个人的心目中,大数据就是企业IT部门的大大小小的结构化和非结构化数据,而且其量正在成倍的增长.但是,尽管大数据已然成为了一种主流的IT现象,多数的大数据项目仍然以失败而告终. 究其原因,就在于企业很难找到适当的方法进行大数据的收集.管理和理解,并最终从大数据信息中提取出有价值的东西. 征服大数据项目,并最终从中提取出您企业所需要的业务洞察力本身就是一项非常艰巨的任务.但当涉及到定义大数据项目的范畴,以及确保相关配套设施到位方面时,您企业的相关人员无法保持统一的步伐,那么,该项目注定是要失败

大数据项目缘何失败?分析模型需要与业务相结合

[TechTarget中国原创] 目前主流的商务智能和分析应用主要关注的是如何从已有数据中提取业务价值,反映公司发展.客户行为和业务趋势.是面向过去的.而一些新兴的数据分析技术已经把目光投向了未来--预测分析.企业通过采用大数据分析技术预测未来可能发生的事情. 但是,预测建模和数据挖掘技术要想准确地预测出客户行为,制定有效的企业战略,需要处理大量的多种类型的数据.医疗保险和医疗保健服务供应商Highmark负责企业信息战略和数据分析的副总裁Mark Pitts表示,要真正落实预测分析,企业需要做

大数据项目为什么失败,2017年将有何不同

  随着企业努力在数字时代完全采用数据驱动,生态系统正在发生重大转变.由于企业应用程序生成数据成为一种趋势和潮流,收集数据的洞察力变得越来越复杂. 此外,数十亿用户和数万亿连接的物联网设备在企业外部产生指数级更多的数据.企业部署云计算,移动和分析技术,希望将这些数据转化为洞察力.然而根据调配机构Gartner预测,2017年将有60%的大数据项目失败.他们不会超越试验阶段,最终将会放弃. 企业在将数据资产链接到战略价值之间发生了什么脱节?根据专家的经验,主要是有工作人员缺乏技能或专业知识,以及技

大数据项目遭遇失败的八个理由

大数据目前已经成为万众瞩目的焦点,已经有众多企业在拼命把自己的数据投付使用.希望借此为重要决策提供支持.尽管大数据宣传与炒作可谓如火如荼,但仍有 92%的企业始终保持中立态度,即计划在"合适的时间"着手实施或者表示不打算接触大数据项目.而在那些已经亲身实践大数据项目的企业中,多数遭遇失败.而且往往是掉进了同样的几个陷阱当中. 取得大数据项目成功的关键在于构建一套迭代型方案,鼓励现有员工参与并使用,从而在一系列无关紧要的失败中学习知识并积累经验. 从众心理 大数据绝对是项转折性的伟大技术

为何多数的大数据项目以失败告终?

 几乎每个人的心目中,大数据就是企业IT部门的大大小小的结构化和非结构化数据,而且其量正在成倍的增长.但是,尽管大数据已然成为了一种主流的IT现象,多数的大数据项目仍然以失败而告终. 究其原因,就在于企业很难找到适当的方法进行大数据的收集.管理和理解,并最终从大数据信息中提取出有价值的东西. 征服大数据项目,并最终从中提取出您企业所需要的业务洞察力本身就是一项非常艰巨的任务.但当涉及到定义大数据项目的范畴,以及确保相关配套设施到位方面时,您企业的相关人员无法保持统一的步伐,那么,该项目注定是要失

没有数据驱动文化 大数据项目将失败

寻求大数据项目的成功?记住:文化为王. Tara Paider,是位于俄亥俄州哥伦布市,Nationwide Insurance公司的IT架构的副总裁,对于数据专家渴望获得大数据项目的成功,给出了一些建议:大数据项目失败的最大原因之一,既不是技术,也不是数据的数量.而是人. 例证:Nationwide的保险代理人的日常工作的一部分,是确保保费上升时,客户不转换到其他保险公司.有一个列表,列出保费将在未来30天内上升的客户,代理拿起电话,与他们最好的客户解释这些变化.一项新客户数据分析项目发现,这

导致大数据项目失败的4大痛点及应对策略

大数据项目通常不会因为单一的原因而失败,而且肯定不会仅仅出于技术原因.这些因素的组合有助于破坏大数据部署.业务战略.人员.企业文化.分析方法或分析工具的细微差别等因素,都可能导致大数据项目出现问题和失败,而这样的失败在数字化转型的过程中在所难免. 常见的痛点 一个成功并且可以获得收益的大数据项目通常包括以下一些特点: 一.预测基础设施需求 指数型增长的数据会对业务基础架构带来挑战,企业需要提前预测自己有多少数据量,需要多少容量,最重要的是要灵活地根据业务需求来增加或提升基础架构,利用合适的工具来

你造吗?这才是大数据项目成功的7大秘密

文章讲的是你造吗,这才是大数据项目成功的7大秘密,大数据项目的成功有哪些法宝?又有哪些陷阱会导致大数据项目的失败?本文中的三位专家将对此进行详解. 如今,许多企业都理解了大数据的构成,但是要取得大数据项目的成功则是另一回事.Gartner公司的分析师,Doug Laney. Forrester公司分析师Mike Gualtieri.International Institute for Analytics的高级研究学者,Robert Morison 都是大数据领域的专家,他们对于企业如何使用大数

纯干货!如何做一个成功的大数据项目

1.失败大数据项目的特征 根据在美国做了15年的大数据项目.产品研发和管理,以及其它一些相关的数据分析的工作经验,了解到的其它的做的比较成功的和失败的项目,跟大家做一个经验分享.基本上大数据项目失败的特征主要是五个: 一是大数据项目与企业战略脱节,完全是领导或者是不知道那个部门的决策人突然脑子一热,就说别人在用,我们也做一个,根本没有把该做的项目和企业的商业战略.科技战略等各个方面结合起来.在项目无法与战略协调,无法在战略的指导下做一款产品或者是服务项目的时候,失败的可能性会非常大. 二是大数据