大数据其实并不存在。
它只是一个模糊的概念,实际操作人员们都知道,它只代表着“关注从数据和分析技术的结合中提取价值”。大数据标志着我们对数据关注重心、推动力和投资方向的转变,而按照现在的惯用说法,“大数据”这个概念包含了或大或小的所有数据。
事实上,大多数新技术刚诞生时,它们的概念都比较模糊。以智能手机为例,在这个概念刚刚出现时,它的名字代表了新奇和创新,“智能”这个词意味着这是新一代的手机。然而随着使用智能手机成为一种常态,“智能”所能代表的意思就越来越少了。
每时每刻,我们都在遇见新类型的数据;它们可能来源于业务单元中的数据集市,或者是来源于数字化渠道或物联网的粒度更细的数据。尽管数据调查的方式可能变得越来越困难了,这些新的数据来源(通常从未被获取过)为我们创造了机会去发现新的洞察。新型数据和数据来源的复杂性和数据的格式问题阻碍了我们对这些数据的利用。
从细微处获取价值
让数字渠道和物联网数据和其他数据区分开来的关键在于数据的粒度(即数据的具体程度)。以往我们通常都在总体水平对数据进行收集、供应及分析;而有限的技术和处理限制让我们想都不敢想去收集这些数据,更别提存储和挖掘数据。
但随着收集数据量的增加,我们逐渐发现并不是所有数据都是平等的。传统的交易来源数据带来的价值立竿见影,但我们提到的那些新来源数据却需要更多的数据准备。在这些数据流中,单一的数据点并不具备任何价值;只有通过长时间统一观察多个数据点的模型和趋势才能真正挖掘到重要的洞察。
数据孤岛
此外,这些新型来源数据需要更新、更低廉的大规模数据存储(通过数据存储把夹杂价值的数据整合起来)。Hadoop等其他技术为我们提供了获取并存储这些数据的工具,但要把这些新技术引入公司就势必需要我们打破现有的IT架构。我们需要向后退一步,最先要关注的并不是将数据整合成同一版本的事实;因为许多企业都有着多个分散的系统,横亘其中的数据孤岛阻碍了企业整体共同应对业务挑战。
你需要向谁汇报?
实际上,企业必须整合所有的数据孤岛,运用技术存储所有数据。但是,我们还必须让使用者能够方便地查询并整合数据、大规模地应用其分析工具。很多企业都低估了整合各部门分析人员这一举动的价值。如果能把客户的是谁、他们拥有什么产品、他们个人的消费者生命价值高低等等客户个人信息与他们在线上的消费轨迹联系起来,那么我们就能从这个组合中获取更多的价值。获取更多关于客户的背景数据能够帮助企业从数字化消费者旅程中受益。
类似的,如果没有机龄、保修信息、服务时长、上次维修时间等机器参数信息的补充,那么从制造工厂传回的的任何一组传感器数据都是冗余数据。数据调查是解锁数据价值的关键。
数字化渠道和物联网这两类新的数据现在已经能够被人们获取并存储了,这将会对所有的业务都造成影响。也就是说,我们必须小心地管理这些数据,给数据分析师自由发挥的空间,不断地整合和分析数据、并从数据中获取洞察。
本文作者:Yasmeen Ahmad
来源:51CTO