如今数据管理越来越受到企业重视,这直接导致了首席数据官职位的出现。
CAMBRIDGE, Mass---数据管理层面受到不同势力的影响,进行数据革新的同时,还需要保证数据安全性和合规性,首席数据官的任务是在二者间找到平衡。
当我们在2016年MIT Chief Data Officer & Information Quality Symposium上遇到Joe Caserta,我们和他讨论了一些与数据管理有关的话题。
Caserta是位于纽约的咨询公司Caserta Concepts的创始人兼总裁,他认为实时数据处理,软件开发和大数据分析是非常重要的。我们的讨论也是围绕这些技术,我们也不可避免的谈到了首席数据官的工作。
新兴的首席数据官职务,旨在平衡数据合规和分析创新,你认为面临的主要挑战是什么?
Joe Caserta:我看到了一些改变,企业越来越向数据分析靠拢。这不仅仅是单个部门的倡议,而是一个企业层面的战略。如果你和首席数据官有过接触,你就会发现,他们的工作通常是应对数据管理、数据安全性和合规性的问题。但这些问题由来已久。人们一直面对这些问题,也一直为其所困扰。
这个职位还要负责与分析相关的工作,这才是其存在的意义。这对与任何人来说都是个挑战,因为它需要人们换个思维方式,与传统数据管理任务有很大不同。我想说的是,当首席数据官独立负责分析工作时,往往效果不佳。CDO需要有同事或下属来分担部分分析工作。
有时候,CDO的工作可以视为一个集进攻与防守为一体的任务,数据革新方面,CDO的任务是进攻,以实现更多的创新,而在数据合规性和安全性方面,他的工作却是防守,防止数据违规和不安全的情况出现。
Caserta:这么说有一定的道理。我们试着引导人们,让他们意识到,数据分析对于他们的业务发展有着十分重要的战略性意义,通常我们发现,大多数IT部门所做的都只是防守。他们就像消防员和灯塔守卫,时刻防止意外发生。如果是这样,那企业将很难取得进步。正如人们常说的那样,如果你一直忙于灭火,那么你就没有时间去思考如何预防火灾。
不过,CDO这个职位越来越受到企业青睐,因为如果企业想要在数据上有所作为,那它就需要这么一个人举起数据革新的大旗。
如果企业将投资用在一个单独的角色或一个单独的部门中,纯粹的为数据服务,而不是将投资分撒在应用程序,开发、支持和基础设施上,那我认为其成功的几率会变得更大。
还有一个流行趋势,DevOps,目前也具有很大影响力。这个趋势是如何形成的呢?
Caserta:我们也许忘了,在大数据和分析成为了企业战略的中流砥柱前,商店会把事务系统中所有的数据提取出来,建立数据仓库,进行数据清理,完成一些报表,也许,如果你做的不错,那你的数据将会被完美的复制,你可以将它们发送回你的应用程序。这就是我们所谓的闭环。数据仓库的意义在此得到了完美体现。
但IT和应用程序的开发有着各自的迭代周期,数据仓库同样也有其迭代周期。但这两个周期并没有什么直接关系,他们之间不必考虑彼此的周期是否对自己产生影响。
现在,大数据平台已经成为一些应用程序的后端,尤其是分析推荐引擎和购买倾向预估一类应用程序更是离不开大数据平台。现在应用程序和大数据平台开始交织在一起。DevOps已经成为强制性的。不再像过去那样是可选的。
数据质量的多重标准是一个挑战,对么?
Caserta:数据质量的困局是你必须面对的。在数据可用之前,必须让数据尽可能的完美,这影响了数据分析的完成速度。这让“Corporate America”感到十分压抑。
这需要做出改变。我认为人们应该意识到:公司向华尔街提交审计报告的合规性与数据发现和数据探索时的合规性有着很大的区别。
我们必须开始考虑相关的用例,以及如何完成合适的数据管理。这是十分重要的。我们曾尝试对医生的笔记做自然语言处理,预测患者是否具有自杀倾向,以阻止患者轻生。但我们最终没有做到这一点,因为企业的数据管理员表示,我们不被允许使用这些数据。
我们需要改变数据的管理思维,让数据能够在更多层面得到使用许可。
开个玩笑吧,我一直都想建立一个委员会来给实时一个明确定义。我曾听到你说,这样的定义不存在。
Caserta:当然。实时的定义取决于你的看法和你的经历。我们来看下Facebook所谓的实时。当你发布一条评论到某人的Facebook主页上,他们并不是在同一时间就收到的。可能在几分钟之后收到。这并不完美。
然而,实时和批量之间有着重要的区别。如果你正在做批处理,那它执行的是一个过程,然后结束。你可以连续运行,即使看似实时,但它仍然是批处理。
对于那些确定已经发生的事,我们不应该试图掩盖。我指的是,交易平台和分析平台之间的界线已经变得非常模糊。如今大多数情况下,预测分析仍然是由批处理完成的,确实是这样。但这些分析结果,取决于你的客户所浏览的页面,他们正在查看什么产品或产品类别,或与其类似的人在做什么,这都需要实时处理。技术正在发生变化,分析和操作平台之间的耦合度变得越来越高。
====================================分割线================================
本文转自d1net(转载)