如何驾驭大数据?

到2018年全球大数据方面的开支将达1140亿美元,是5年前的3倍;到2020年全球大数据规模将达44ZB(泽字节),是2013年的10倍。下一波大数据浪潮即将来袭,但是并没有多少组织为此做好准备。如果应对措施不当,你可能就不是弄潮的那个,而是被浪尖打翻的那个。如何为驾驭大数据做好准备呢?请看Crewspark CEO Cameron Sim的文章。

1140亿美元。这是2018年全球组织在大数据方面的开销,仅仅5年的时间就增长了300%以上。但是这些投入有多少是值得的呢?

过去10年,我们目睹了大数据管理新方法的广泛应用,如MapReduce、供大规模存储使用的非模式化数据库,以及用于存储和处理的Hadoop、Storm和Spark等。但是大数据的使用不仅仅是特定平台或范例的部署而已:理想情况下这意味着公司对数据的建构和组织要如何进行彻底的重新设计。

但据调查发现,目前还没有多少组织为新的数据平台和能力做好基本准备。只有35%的组织拥有了“健壮的数据捕捉、管理、验证及保存流程”,更有67%“缺乏衡量定义明确的大数据行动成功的标准。”那些大数据解决方案基本都是被动集成进来的。

但时间可不等人,根据2014年IDC的报告,到2020年,全球的数据总量将达44ZB,整整是2013年的10倍。面对着下一波的数据大爆发,那些未做好准备的公司将可能就会有背负运营和技术双重债务的风险,并因数据落后而被淘汰出局。

具体而言,这些风险体现在以下几个方面:

企业丧失透明度

业界将面临大规模的技能短缺问题——很少有IT专业人士有经验管理大规模的大数据平台。根据麦肯锡的分析,到2018年,美国将出现150万名有能力做出基于数据决策的经理。为了缩短这一鸿沟,麦肯锡估计企业将需要把数据和分析预算的50%投入到一线经理的培训上面。但是还没有多少公司意识到这一点。

随着数据需求的扩大,如果对信息管理缺乏深刻理解,对数据扩展性缺乏最佳实践,那么在管理数据驱动的系统时就会遭遇到重大挑战。而糟糕的运营透明度会导致企业很难识别出数据何时不准确和无意义,甚至连关键报表和指标是否正确运行都不知道。理清这些错综复杂并对数据提出正确的问题将成为IT人员的必备技能。否则就会缺乏对企业运营的可视性,无法有效做出知情决策并削弱企业的竞争优势。

人工成本飙升

据估计2014年时数据科学家50-80%的工作时间花在了数据集清理和处理上。近期公司往往倾向把数据准备工作的自动化外包给离岸或近岸的数据专家。对CloudFactory、MobileWorks及Samasource这类微工作平台的需求已经爆发,据估计,到2018年这类业务的规模将达到50亿美元。

但是外包无法规模满足需求。鉴于未来的数据量将达到44ZB,数据的这种快速增长会需要成千上万具备长期可行的解决方案的离岸或近岸外包团队。而任何可持续的解决方案都离不开显著的自动化。

通信障碍

现在企业间的交互依靠的是经过组织的数据,但与未来20年发生的事情相比,这种组织数据的过程将会显得苍白无力。未来将会出现新的企业数据网络标准以及相应的算法和元数据。未能参与到这一全球数据市场的公司将无法利用市面上销售的这些数据产品。

全球各个领域都在发生这种朝着大规模商业数据共享的演变。比方说,在要求第三方验证其研究的压力之下,像葛兰素史克这样的药企最近都拟定了更广泛共享实验数据的计划。奥巴马总统已经要求技术公司共享潜在黑客威胁的数据。Forrester最近的一项研究预测,数据服务将成为2015年的主流产品。按照这种节奏,10年后大数据的有效使用不仅会成为市场致胜的关键,而且还是参与市场的先决条件。

这些风险就像一个个大数据的定时炸弹,对你构成严峻挑战。不过如果你采取下面的三个步骤,危险也许就可以解除。

1、不要走一步看一步

为了确保未来的分析能力,企业必须现在就开始投资一个能够快速有效管理新数据集的平台。应该考虑业务未来在数据摄入与联合方面如何运作,如何从传统的系统过渡到端到端的自动化的数据与分析。

其核心是这个平台要能够有目的地、小心地、透明地扩充,而不是光收集数据,但对这些数据使用却没有明确的目的,或者在数据的解析上不做投入。

2、再痛也要重建旧数据应用架构

许多公司过度依赖维护开销很高的旧系统,导致升级或作出战略变革的优先性被贬低。甚至一些大公司也是如此,比方说三星的SmartHub TV是跑在云上面的,但是因为顾忌迁移成本,其所有的金融交易仍在本地处理。

其结果就是在许多组织里面数据形成了一个个以部门为单位的烟囱。某些数据,比方说社交媒体方面的信息,甚至还保存在公司以外,这又增加了一层复杂性。要想大数据创新,企业必须以提高跨部门运营透明度为焦点对旧的数据应用进行翻新。

3、模块化、多颗粒度的数据管理

要把裸数据和洞察数据塑造成模块化、组织得当、具备各种颗粒度的实体,这一步做得越深入,越能够有效的利用商业洞察,同时还能在永远变化的大数据形势中保持敏捷的反应力。

本文作者:佚名

来源:51CTO

时间: 2024-09-20 16:54:43

如何驾驭大数据?的相关文章

零售品牌如何驾驭大数据主导商业决策?

从渠道粗放管理,商品粗放管道到移动互联网蓬勃发展,零售企业面对全渠道整合发展,也需要重新构建全渠道解决方案.零售不应再简单以线上.线下独立区分,而将真正从消费者的角度出发,逐步演变为各渠道融合,由卖出商品升级为与消费者建立情感联系.当消费者在实体店铺经过了解,试衣,选择某品牌的商品进行购买,那么,现在的消费者需要用他们最习惯的方法能保留下下次有机会再连接的方式,这个方式不仅仅是再次来店,也许是该品牌上新的图片或是秒杀,促销的信息.这才是消费者"偷懒"的想法,因为现在消费者选择的成本太大

《驾驭大数据》一8.4 优秀分析专家身上经常被低估的特质

8.4 优秀分析专家身上经常被低估的特质 驾驭大数据 下面我们讨论优秀分析专家身上最关键的特质.这些特质对其他业务领域也是有价值的,我们这么说并不是要否定它们对于分析的重要性.下述的每种特质都比我们以前讨论过的更重要.维持既有的分析流程会容易一些,如若要寻求新的突破,建立新的分析流程,人才招聘和人才挽留就显得比较重要了.要想成功地驾驭大数据,完成支撑大数据所需要的具有创新性的新业务分析流程,我们需要跨过更高的标杆. 8.4.1 承诺 承诺是普惠每个行业的特质.总会有人愿意挥洒汗水让项目按时交付,

《驾驭大数据》一3.5 电力行业:智能电网数据的价值

3.5 电力行业:智能电网数据的价值 驾驭大数据 智能电网是下一代电力基础设施.与我们周围经常见到的高压电传输相比,智能电网更先进更可靠.智能电网有非常复杂的监控.通信和发电系统,可以提供稳定如一的服务,如果出现停电和其他问题,可以更好更快地恢复.各类传感器和监控设备记录了电网本身和流经电流的许多信息. 智能电网中的一个环节是我们经常提到的智能电表.智能电表是一种传统电表的替代品.从外观上看,智能电表和我们一直使用的电表没有什么不同,但智能电表的功能更强大.以前抄表人员都是每隔几周或几个月就挨家

【重磅】互联网金融生态系统系列报告:金融机构如何驾驭大数据?

昨日,波士顿咨询公司发布<互联网金融生态系统2020系列报告之大数据篇--回归"价值"本源:金融机构如何驾驭大数据?>,大数据文摘第一时间得到授权,分享给各位读者. 回复"波士顿咨询"可一并下载3篇系列重磅文章: <互联网金融生态系统2020系列报告之大数据篇--回归"价值"本源:金融机构如何驾驭大数据> <BCG_互联网金融生态2020--新动力.新格局.新战略> <张越:变革时代新战略.新工具>

《驾驭大数据》一导读

前 言 驾驭大数据你收到一封邮件,邮件中提供了一套个人电脑的报价.而你几个小时前刚刚在这家零售商的网站上搜索过电脑的信息,似乎它们已经读出了你的想法--当你驱车前往这家商店购买这套个人电脑时,你路过了一家咖啡店,你看到了这家咖啡店的一条折扣信息.你获知由于你刚来到这片区域,你可以在未来20分钟内享受10%的折扣-- 在你享用咖啡的时候,你收到了一家制造商关于某产品的道歉,而你昨天刚刚在你的Facebook主页和这家公司的网站上抱怨了它们的产品-- 最后,当你回到家之后,你又收到了一条关于购买你最

《驾驭大数据》一8.5 分析认证有意义吗,还是干扰视听的噪音

8.5 分析认证有意义吗,还是干扰视听的噪音 驾驭大数据近来关于开发分析专家认证项目的讨论多了起来.这类认证从概念上讲和注册会计师认证(CPA)以及理财规划师认证(CFP)没有什么不同.分析专家这种职业有必要发起认证项目,好让用人单位可以评估哪些人满足了最低用人门槛吗? 我曾经读到过有一些组织想要开发这类认证项目,也参与讨论过一些很酷的想法.最大的挑战在于要确切地弄清楚需要测试的内容.如若想要识别优秀的分析专家,我们前面已经很细致地讲过,技术敏感度很容易测试,但单纯参考关于技术的评价就是一种赌注

《驾驭大数据》一第3章 典型大数据源及其价值

第3章 典型大数据源及其价值 驾驭大数据当你开车路过一家餐厅的停车场时,你的手机屏幕上弹出了这家餐厅的当日特价菜品推荐,这种体验是不是很棒?如果赌场老板把发牌人忘记付给你的20美元亲自送还给你,你的心里是不是有点儿小激动?如果在线视频游戏能够把和我们玩法相近的用户即刻告知我们,这世界会不会变得很美妙?你是不是要下调汽车保险费率?大数据能让这一切变成现实. 在第2章中,我们已经讨论过了网络数据.网络数据即使不是最原始的大数据源,也是使用最广泛.认可度最高的大数据源.除此之外,还有很多大数据源,它们

《驾驭大数据》一3.8 视频游戏:遥测数据的价值

3.8 视频游戏:遥测数据的价值 驾驭大数据遥测数据是视频游戏产业的一个术语,用来描述捕捉游戏活动的状况.其概念与我们在第2章所讲的网络大数据无异,这是因为遥测数据收集的是玩家在游戏中的活动情况.遥测数据的收集对象多数情况是在线游戏而非掌上游戏. 在曲棍球比赛中,遥测数据收集的是运动员在击球进门时,何时进的球,用的哪种击球方法,球速多少.在战争游戏中,遥测数据收集的是用哪种枪械开的火,在哪里开的火,向哪个方向开的火,枪械对各种东西的破坏程度.从理论上讲,相关场景和活动的所有细节都能够被收集到.

用智能新网络驾驭大数据时代

文章讲的是用智能新网络驾驭大数据时代,"中国宽带运营商一直希望智能化,要做管道经营,但是真正非常成功的商业模式现在还在探讨当中."上海贝尔执行副总裁桑须雷近日在接受记者采访时表示,"最核心的问题就是真正端到端网络管理全网还是有瓶颈的,专业分工太多了.只有实现了精细化管理,到后台的云才真正发挥它的效益,才真正把云成为一个服务卖给人家.很多全球运营商现在面临最大挑战,投了很多数据中心但不一定赚钱.在这一块上面如果没有精细化管理的能力,没有差异化的服务和普遍基本服务外的增值应用,客

《驾驭大数据》一3.3 多个行业:时间数据与位置数据的价值

3.3 多个行业:时间数据与位置数据的价值 驾驭大数据随着全球定位系统(GPS).个人GPS设备.手机的出现,时间和位置的信息一直在增加.从Foursquare到Google Places,再到Facebook Places,它们提供了大量的服务与应用,可以记录每个人在某个时间点的位置.手机应用程序可以记录我们的位置和移动的轨迹.即使手机没有正式开启GPS,我们还是可以使用基站信号来获得相当准确的位置信息. 消费者应用程序中有一些新颖的使用这些信息的方法,这些方法可以捕捉到消费者允许其捕获的信息