大数据治理不容忽视

 本文介绍了IBM副总裁Ron Ben Natan博士对大数据治理的分析,着重阐释了大数据治理难题和IBM大数据治理的实践。

当畅销书《大数据时代》的作者维克托·迈尔-舍恩伯格在谈到大数据给信息时代带来的变革时,他认为相对于“小数据”来说,我们不再热衷于追求大数据的精准度。或者我们可以将其理解为大数据定义中的第三个V,即Value(价值)。大数据的价值密度相对于传统交易数据会比较低,在大数据时代,我们不必去追求每一条数据都准确无误,数据的混杂以及相互作用让我们从之前的探寻因果关系转化为寻找事物之间的相关性。

那是不是意味着大数据时代,我们将不再需要进行数据治理(Data Governance)?答案是否定的!在2013 IBM技术峰会上,TechTarget中国记者采访了IBM杰出工程师、副总裁兼Guardium首席技术官Ron Ben Natan博士,他认为大数据治理比传统数据治理更困难,存在更多的挑战。而用户需要从数据开始生成的时候就开始考虑以大数据的方式来进行治理。

大数据带来治理难题

大数据的魅力在于为提升公司的竞争优势提供必要的洞察力:公司可以利用它发现客户及其他与业务息息相关的元素。对于走在大数据前沿的实践者来说,缺乏正确的数据治理流程会造成数据错误,从而导致分析结果的偏差以及无形成本的增加。

Ron Ben Natan博士认为,大数据治理的难度体现在:首先既要考虑传统数据的治理,又要兼顾新型数据存储方式的变化,比如NoSQL;其次大数据来自于多个数据源,这些数据源有内部的数据也有来自外部的数据;第三,大数据的数据结构更多,如JSON、Avro等,数据治理的复杂程度更高;最后,大数据的量非常大,海量数据给治理带来了更大的压力。

为了从大数据中获得有意义的业务信息,我们需要完成所有的相关工作,如数据的语义分析,然后再将它转变为概念模型或知识。因此整个过程就需要数据治理的参与。Ron Ben Natan博士把大数据治理比作“把所有的鸡蛋都放在一个篮子里”,如果这些大数据的数据质量不高,在商业决策上就会产生巨大的风险。Ron Ben Natan博士表示:“大数据的治理不只是说当你有了这些数据之后开始治理,而是从数据开始生成的时候就开始考虑要以大数据的方式来进行治理,需要整个生命周期的大数据治理。”

IBM的大数据治理最佳实践

在发布大数据战略之初,IBM就一直强调治理的重要性。Ron Ben Natan博士表示,IBM在大数据治理方面已经有了三年多的积累,并总结出一套大数据治理的最佳实践。这其中包括:

1、 让现有的数据转换成大数据可以使用的数据集,同时提供双向的转换。IBM提供了一系列工具,可以在现有企业的关系型数据和大数据需要的数据模型下进行自由的转换。

2、 大数据环境下进行数据屏蔽。当把所有的数据放在一起,数据中很多部分跟企业和个人相关的数据是具有敏感性的,在不同的人手里这些敏感的数据用做不同的用途,有一些是有害的,企业需要在这些数据流入流出的过程当中避免敏感数据的泄露。

3、 对大数据进行加密。我们需要保证不同节点中的数据不被他人非法利用。这里谈到数据的加密,可以提供透明的方式,保证只有特定的用户使用特定的应用程序,或特定的方法来访问到真实的数据。

4、 Hadoop环境下的数据保护。Hadoop是大数据时代最流行的数据存储方式,企业大量数据存储在HDFS中,因此需要对这部分数据进行充分的保护。Ron Ben Natan博士介绍,IBM对开源Hadoop以及IBM的BigInsights都提供这样的数据保护方案。

Ron Ben Natan博士介绍,IBM结合了传统数据治理的经验,在过去几年中积累并且建立了大数据治理的策略和Guardium产品,同样也是迄今为止市场中最完整的大数据治理产品组合。而未来IBM也会尽力去投资增加在大数据环境,尤其是NoSQL环境治理的工具和方案。对此Ron Ben Natan博士表示,尽管NoSQL并不是IBM传统关注的领域,但NoSQL对传统数据库的增强作用是显而易见的,因此IBM有许多客户都开始进行NoSQL的尝试。而包括电商等互联网客户,也存在着与传统供货商直接的业务交流,这其中可能就会涉及到相关NoSQL数据的治理。

“客户有这样的需求,IBM就会为客户提供你所需要的所有工具。” Ron Ben Natan博士说。

原文发布时间为:2013-12-20


时间: 2024-10-23 19:11:02

大数据治理不容忽视的相关文章

大数据治理:地方政府准备好了吗?

 一.引言 大数据时代的来临,为政府治理创新和公共服务绩效改善创造了巨大契机,但也提出了不容忽视的严峻挑战.2015年8月,国务院印发<促进大数据发展行动纲要>(国发[2015]50号,以下简称<行动纲要>),将大数据发展和应用提高到国家战略层面.这项动议几乎要把全社会的所有力量都动员起来,但是对地方政府的角色和定位却并没有明确和清晰的界定.<行动纲要>在两处专门提及地方政府,一处是"结合信息惠民工程实施和智慧城市建设,推动中央部门与地方政府条块结合.联合试点

数字化转型中的大数据治理架构

大家好,我今天分享的主题是大数据治理.我们如何使用好大数据资产,才能够更好地发挥其中的价值? 主要大纲: 一.数字化时代大数据向服务化发展 二.数字化时代的大数据治理架构 三.大数据治理的12个技术原则 四.总结 一.数字化时代大数据向服务化发展 本文讲的是数字化转型中的大数据治理架构,数字化时代,我们的数据来源比以前更广了.第一,之前传统企业政府的IT系统主要是面向内部使用,产生了一些信息,现在已经面向外部使用了:第二,更多行为信息.社交信息都会变成企业的数据:第三,我们有很多非结构化的数据,

普元王轩:做好大数据治理,加速航空业数字化转型

9月20日,2017全球航空旅客大会在上海启幕.来自国内外政府机构.行业协会.国内外领先航空公司.机场集团等领导齐聚一堂,探讨面对全球化和数字化带来的全新挑战,在"一带一路"的时代背景下如何提高服务质量,革新航空旅客体验.普元大数据产品线总经理王轩出席会议,并发表演讲<做好大数据治理 加速航空业数字化转型>,强调航空业数字化转型,需要以大数据为驱动,做好面向业务的自服务大数据治理,上衔数据,下接用户,才能保证航空大数据的有效利用. 数字化时代席卷而来,航空业转型关键点浮出

浅谈自服务的大数据治理在企业数字化转型中的妙用

一.用户与大数据之间的鸿沟让数字化转型困难重重 本文讲的是浅谈自服务的大数据治理在企业数字化转型中的妙用,目前虽然不少企业已经广泛建设大数据平台,但却难以直接使用平台中的大数据,企业人员与大数据之间存在着一道难以逾越的鸿沟. 这道鸿沟的出现导致企业在使用大数据的过程中出现数据不可知.需求难实现.数据难共享等一系列问题: 1.数据不可知,数据价值无处可寻 企业环境中到底有哪些数据,这些数据在哪里,慢慢变成了大数据平台的"迷",用户迷失在动辄几十PB的数据中.对于企业管理者来说,无法从管理

金融行业大数据治理背后藏着什么样的答案?

ZDNET至顶网CIO与应用频道 11月04日 北京消息:金融行业是典型的数据驱动行业,自人民银行携手全国金融标准化技术委员会启动<银行业标准化体系框架>研究工作以来,人民银行先后下发了<金融业机构信息管理规定>.<贷款统计分类及编码标准(试行)>.<存款统计分类及编码标准(试行)>等多项标准,并牵头组建了有24家银行组成的金融统计标准化工作小组,加大数据标准化的工作力度."数据是重要资产"的观念已经在金融行业成为共识.那么,问题来了:

大数据治理:成熟度评估框架

Goals:目标 Business Outcomes:业务成果 Enablers:支持要素 Organizational Structures & Awareness:组织结构和认识 Stewardship:管理人员 Data RiskManagement:数据风险管理 policy:策略 Core Disciplines:核心准则 Data Quality Management:数据质量管理 Information Lifecycle Management:信息生命周期管理 Informati

大数据治理需要具备哪些能力和关键技术?

在企业数据建设过程中,大数据治理受到越来越多的重视.从企业数据资产管理和提升数据质量,到自服务和智能化的数据应用,大数据治理的内容在不断发展和完善,其落地实施的过程中会遇到各种各样的难题和挑战.本篇文章通过分析大数据治理建设中的沟沟坎坎,总结出了大数据治理需要具备的能力和关键技术. 一.困难重重却充满光明的大数据治理发展之路 1. 传统数据治理一直无法逃脱的魔咒 大数据治理从建设内容和实施目标上可以划分成不同的阶段,每个阶段完成不同的任务,随着阶段的递进,建设内容逐步加深,不同的企业切入点和诉求

政府拥抱大数据 治理迎来新格局

文章讲的是政府拥抱大数据 治理迎来新格局,在全社会信息量爆炸式增长的背景下,政府部门该如何拥抱大数据?专家建议,一方面要加强与大数据分析企业.互联网公司的合作,获取更丰富的数据,另一方面要开放一些政府数据给企业,发挥企业的智力资源与技术实力,为政府提供决策支撑- 国办近日印发<关于运用大数据加强对市场主体服务和监管的若干意见>,提出充分运用大数据先进理念.技术和资源,加强对市场主体的服务和监管,推进简政放权和政府职能转变,提高政府治理能力. "这是适应时代需求的必然选择,是智慧城市建

“工程师”与“园丁”:大数据治理中的政府角色

在大数据治理中,政府必须同时扮演好两种角色,即"工程师"和"园丁"."工程师"呈现了政府刚性的一面,它是技术专家对经济社会的直接干预:除了刚性,政府还有"园丁"的一面,主要体现召集人.催化剂的角色,给社会发展和成长留足空间. 在大数据治理中,政府的目标是多样的.一方面要提高行政效率,促进大数据产业发展,引领和带动新兴产业,推动经济转型升级:另一方面要加强监管,维护社会公平正义,预防数据泄露,减少社会风险.政府必须同时扮演好两种