非结构化数据评测:Veritas发布首个《数据基因指数》报告

3月18日,数据管理解决方案供应商Veritas发布该公司首份《数据基因指数》报告,为了进一步了解客户数据环境的真实结构,Veritas在2015年分析了来自众多客户非结构化数据环境的数百亿份文件及其属性。此次分析涵盖8000多种常见的文件类型扩展名。因此,报告中的数据基本能够代表客户文件系统环境的数据构成。与此同时,Veritas旨在探索全球数据发展趋势的数据基因项目(Data Genomics Project)也正式启动,该项目将建立一个数据科学家、行业专家以及思想领导者的的讨论社区,为信息管理提供丰富的数据基因图谱,同时将研究和讨论结果分享给全球的企业用户,帮助他们应对数据增长的困难。

《数据基因指数报告》是基于Veritas全球客户数据(当前不包含中国区)分析得出的可供市场参考的研究报告,作为业内首个基于企业实时数据基准评测报告,《数据基因指数》将首次公开当前企业数据组成的精确视图。

当前企业IT高管对于IT环境的判断有了新的变化,更多的CIO面临更多的困惑和难题,软件定义怎么实现?混合云模式如何构建?我的IT部门的技能和知识储备能不能跟得上变化的步伐?与此同时,企业业务部门、高管对IT的期望越来越大,而显然,传统的通过基础架构管控IT的方法在硬件逐渐成为大宗商品的时代已经无法掌控企业的IT脉搏,Veritas在近两年的转型过程中也做出了自己的探索和思考,Veritas认为企业应该转换IT管理和控制的思路,由传统的基础架构层面的管控转向基于数据的洞察和治理。

随着IT治理思路的转变,Veritas面向市场的产品策略和发展方向有了新的变化。

首先,企业现有数据管理能否对现有基础架构的高度复杂性进行屏蔽。例如:原来的数据可用性很简单,都可以存储在一个数据中心或两地三中心,复杂性有限;但如今,企业处于混合云环境中,能够将数据分散放在私有云以及不同的公有云中,因此,在这种环境下实现数据管理是非常具有挑战的。

第二,过去的信息管理系统以基础架构为关注点,但如今新的管理系统应该以数据管理为核心出发点。其实,企业只要能够随时访问数据,并不关心该数据的具体位置。这也是由于虚拟化后,数据是不固定存在的。

第三,面向服务。在过去,所有数据信息都依赖于IT人员。而现在,Veritas要把信息的控制权交给数据所有者。如果审计部门是一个数据的所有者,那么企业应该为其真正所有者提供访问工具,而不是依赖IT部门。

第四,信息管理工具间需要协同联动,打破各自孤立的状态,实现对现有工具进行兼容。

Veritas大中华区技术支持部高级总监李刚表示,我们希望做出符合上述需求的产品,让客户能够真正有一套完整且面向服务的体系。该体系能够屏蔽新的IT基础架构,将数据控制权交给数据所有者。这将是一个开放和包容的体系。虽然Veritas并不能够百分百的实现所有数据管理,还需要借助集成用户现有或者其他友商的工具,但Veritas提出这样的框架和概念,我们自身正在逐步完善这种体系。

近日,Veritas发布了新一代的Enterprise Vault 12和Data Insight 5.1,作为Veritas整体产品视图中的关键组成,两款产品都推出了适应数据趋势变化和提升企业数据洞察的新特性。

从企业存储数据并进行电子发现的角度,Enterprise Vault 12中重点突出了影像扫描、数据分类、智能审查以及归档检索功能。关于数据分类,如果企业需要对10万甚至100万个文件直接进行扫描和归档,操作期必然相对较长。但如果根据企业数据类型进行分类标记,就能够快速找到目标对象。此外,影像扫描也十分重要,如果不希望涉密信息被别人截获甚至恶意盗取的话,企业可以通过OCR这种方式反向扫描,利用关键字直接发送照片,从而保护邮件安全。

Data Insight 5.1则是从另一个维度来分析结构化数据的访问和使用情况。企业能够通过统计,了解企业数据年限、数据访问情况、缩减备份需求的数据比例等。而此次Data Insight 5.1也做出了近一步的扩展,开始覆盖云端及BOX的数据信息,帮助企业了解网上数据的使用。

本文转自d1net(转载)

时间: 2024-10-23 08:25:55

非结构化数据评测:Veritas发布首个《数据基因指数》报告的相关文章

美国数据科学家:重视非结构化数据分析 走出两大“经典”误区

虽然基本上国内大部分公司,言必提"大数据",但是对于大部分CIO.CTO们来说,对数据的分析仍然停留在过去的阶段:对于非结构化数据分析的成熟度还远远落后于结构化数据. 但是现在移动端所带来的爆发式增长给大数据从业者带来了非常大的挑战,这些数据有很多是非结构化数据,充斥了人们交流的空间,相应的,对非结构化数据的分析也变得越来越重要--对非结构化数据进行分析.提取出有价值的东西,成为CIO.CTO们最关注的问题. 但是目前,很多人仍有非结构化数据分析等同于舆情分析的粗暴认知. 非结构化数据

从原始数据到数据科学:使非结构化数据结构化,以推动产品开发

数据科学正在快速发展成所有行业开发人员和管理人员的关键技能,它看起 来也十分有趣.但是,它非常复杂,虽有许多工程和分析工具助力,却也难清楚掌握现在做得对不对,哪里是不是有陷阱.在本系列中,我们解释了如何发挥数据科学的作用,理解哪里需要它,哪里不需要它,以及如何令它为你产生价值,如何从先行者那里获得有用的经验. 这是"Getting A Handle On Data Science(理解数据科学)"系列文章中的一部分. 本文要点 从非结构化的机器日志到提供当前特定信息的高度结构化的数据分

IBM软件发布分析洞察战略应对非结构化数据激增

5月18日消息,http://www.aliyun.com/zixun/aggregation/13660.html">IBM软件正式发布了基于业务分析洞察(BAO)理论基础之上的IBM智慧的分析洞察(Smarter Analytics)战略,以帮助企业分析 复杂的数据. 该战略融合了IBM大量的软件产品,包括大数据平台.分析型数据仓库等解决方案.财务绩效管理.商业智能.预测分析.内容分析和风险分析等产品. 从2005年来,IBM收购了FileNet.Cognos.ILOG.SPSS.Op

IBM发布面向大数据及非结构化工作负载的DeepFlash 150全闪存存储

IBM本周二扩大了自己的全闪存存储产品线,增加了一款瞄准大数据和其他非结构化数据应用的产品. "新推出的IBM DeepFlash 150计划从本周晚些时候开始出货,针对那些要求标准全闪存存储解决方案不具备的容量的应用."IBM存储系统.文件和对象存储产品总监Alex Chen表示. 大多数全闪存存储阵列专注于更为传统的应用,例如VDI虚拟桌面.块存储和在线交易处理等. 分析师告诉我们,有80%的数据都是非结构化的,大数据对于闪存存储来说是一个不同的问题.自有了大数据,数据就迈向了PB

【数据蒋堂】非结构化数据分析是忽悠?

大数据概念兴起的同时也带热了非结构化数据分析.传说一个企业中80%的数据都是非结构化数据,如果按占据空间来算,这个比例大体不假,毕竟音视频这类数据真地很大.有这么大的数据量,需要进行分析是很自然的事了,而要分析当然就要有相应的技术手段了. 那为什么说非结构化数据分析技术是忽悠呢? 不存在通用的非结构化数据计算技术 非结构化数据五花八门,有声音图像.文本网页.办公文档.设备日志.....:每类数据的都有各自的计算处理手段,比如语音识别.图像比对.文本搜索.图结构计算等等,但是并不存在一种适用于所有

通过SQL 2008管理非结构化数据

通过SQL Server 2008管理非结构化数据 SQL Server 技术文档 作者:Graeme Malcolm (内容主管) 技术审核员:Shan Sinha 项目编辑:Joanne Hodgins 发布日期:2007年8月 适用产品:SQL Server 2008 概述:数字化信息的增长为企业应当存储和访问业务数据的方法提供了启发.数据库作为业务应用程序的核心,必须能够同非结构化的数据进行集成,其中包括文档.图像.视频.以及其它多媒体格式.为了能够对信息生命周期进行管理,满足策略需求,

企业如何保护非结构化大数据

目前企业已经进入全新的大数据时代.在高带宽.移动的.网络环境中工作和生活的我们,会产生 大量的数据,这些都成为大数据的来源,而这些信息很少存在于同一个地方.在几微秒中,信息就能够发布给世界 各地的很 多人.企业的高管门(包括CEO.CIO.CSO等)都必须面对因为大数据带来的风险和安全挑战,并规划好如何去应对他们.本文将讨论如何 看待非结构化数据相对于传统的结构化数据带来的安全风险和挑战以及多层面防护方法.识别非结构化数据与结构化数据安全保护的差异信息通常被归类为结构化形式的或非结构化形式的.不

从非结构化数据中发现问题 富国银行的风险分析之道

9月初,美国消费者金融保护局称美国富国银行(Wells Fargo)员工在未告知客户的情况下,自2011年起私自建立近两百万个虚假银行账户,富国银行被要求支付1.9亿美金高额的罚款. 9月中旬我也在大洋彼岸见到了美国富国银行企业模型风险部副总裁刘维政(Richard Liu),第二次见面没有客气,一上来我就提出了"幽灵账户"和风险管控的问题.虽然刘维政最近正热衷于研究和学习太极,但他却并没有和我"打太极". "这一现象其实在很多银行都可能发生,可能只是没有

如何管理非结构化互动数据

本文讲的是如何管理非结构化互动数据,[IT168 资讯]非结构化数据仍在持续增长,而且增长势头似乎毫不减弱.事实证明,对这类数据制定政策和分级将是一项异常艰巨的工作.而且大部分人事后并没有回顾和分析哪些数据应保存在哪里,保存多久的时间以及如何保证它们的安全性.在当前这种紧缩时代,这项工作也很艰巨. 这些近似命令如何执行? 如果我们用互动的方式来管理数据,会怎么样?  互动数据管理会在你保存数据的同时给那些数据制定政策和赋予信息,无需使用专门的文档管理软件.正如我们在 <George Crump: