数据基因指数:从不同视角挖掘数据价值

今天,企业访问数据、管理数据成为企业的必修课。但是要对数据进行进一步挖掘,就需要对数据有更深刻的认识。近日,Veritas发布《数据基因指数》报告。Veritas认为了解和分析全球数据的基准环境,对行业发展来说也非常重要,同时也能够为企业带来不一样的视角来处理数据带来的价值。

Veritas大中华区技术支持部高级总监李刚认为《数据基因指数》的推出是当前企业对于数据的息息相关。

 

Veritas大中华区技术支持部高级总监李刚

由于当前IT行业基础架构环境发生了重大改变,这种改变已经深入到客户的日常工作中,因此,大多数企业对于现今的IT整体环境感到既兴奋又迷茫。企业不了解要如何实现软件定义,不清楚如何在IT规划中构建混合云模式?不明白要怎样应用知识储备和技能储备以应对挑战?什么样的合作伙伴能够帮助企业发展?这些之前在市场活动中所谈论的问题,如今都尖锐地摆在CIO和IT主管面前。

李刚认为该报告的发布与Veritas对如今IT环境的看法高度相关。Veritas认为企业需要转换思路,不该执着于关注基础架构,而应该多关注数据。未来的企业都会是IT企业/数据企业。所以,企业IT决策者们真正应该关注的,是对数据的管控。之前,企业对数据的理解是在应用层面上,没有对整个数据做全局的理解。Veritas认为,企业IT如果要重新控制核心能力,便应该加强对数据的掌控。数据是企业真正的核心资产,这是Veritas对未来的一个理解。

企业掌控数据的第一步是去洞察数据。对于企业CIO来说,理解数据是最重要的。Veritas试图通过《数据基因指数》报告,从宏观角度来分享我们对企业IT的洞察,希望能引起每一位企业IT管理者、IT决策者对企业IT数据的思考。

 

Veritas高级产品市场经理Christopher Talbott 

《数据基因指数》的数据来源从哪里来?Veritas高级产品市场经理Christopher Talbott 表示Veritas首先访问了数十亿条企业真实环境中的元数据,对其具体情况进行了解并分析这些元数据所关联的具体文件。之后,Veritas根据得到的数据特征进行整合汇总,从而分析得到平均状态下,企业数据环境结构中数据的年限、类型、大小、所有权等一系列信息。

《数据基因指数》(Data Genomics Index)报告,是首次在业界公开由企业数据组成的精确视图。报告也提出一些有趣而且有意义的发现。

1.    过去十年,演示文稿文件的数量下降500%

《数据基因指数》报告揭示,图片、开发者文件和压缩文件大约占企业环境总容量的三分之一。从文件数量上来看,开发者文件占总量的20%。回顾过去10年的IT发展趋势,与其他文件类型相比,演示文稿文件的数量下降500%。可以说,演示文稿当道的时代已经过去。

2. 报告显示秋季成为存储旺季 冬季是备份激增

秋天是文件创建的旺季。文本文件的增长率尤为突出,高达91%;其次是地理和信息系统文件,增长率为89%;电子表格的增长率为48%。通过本次调研可以总结出,企业通常在夏季和秋季录制视频,并将录制内容保存在公司的磁盘中。在秋季,视频量会迅速增长68%。冬季,则备份文件激增。

3.在数据环境中,41%的数据长期无人问津

根据规定或合规要求,数据通常在3年后会从“可能相关”变为“过期”状态。令人难以置信的是,在企业中,平均41%的企业数据已经过期,或者是连续3年没有任何用户对其进行过修改操作。

4. 为孤立数据买单,企业很头疼

由于职位变更或员工离职,数据将失去其所有者,成为孤立数据。企业对这类数据通常选择忽略,但它们却不断花销企业的成本。根据《数据基因指数》报告的分析洞察,孤立数据多为内容丰富的文件类型,例如视频、图片和演示文稿等。如果企业选择忽略这类数据,将会造成一定的潜在安全风险。孤立数据也占据大量的磁盘空间,超出所应占空间的200%。

5. 小变动或极大影响企业存储成本

如果能够洞察自身数据,企业可以明确划分优先区域,从而实现最大的回报。演示文稿、电子表格和文档等传统Office格式文件所占据的空间远远超出合理数值,这为企业造成不必要的成本负担。同时,视频和图片等视觉格式文件也是企业的另一负担。企业应该对此类文件实施归档、删除和迁移工作。以10PB为普通环境举例,开展一项专门处理过期演示文稿、文档、电子表格和文本文件的归档项目就能为企业每年节省大约200万美元的存储成本。

我们看到一方面《数据基因指数》可以让人们从宏观上全面发现企业对于数据的利用情况,另一方面可以真正实现通过IT架构的改变和数据的管理实现企业成本调控。就比如根据实时的企业数据视图表明,40%以上的企业文件在3年内处于无人问津的状态,孤立数据占据大量的磁盘空间,演示文稿、电子表格和文档等传统Office格式文件所占据的空间远远超出合理数值,这些调研结果,都能让企业精准的对过期的、孤立的数据进行归档、删除和迁移工作。从未大大降低企业的数据存储管理成本。

原文发布时间为: 2016年03月24日

本文作者:任新勃

时间: 2024-09-15 15:30:34

数据基因指数:从不同视角挖掘数据价值的相关文章

非结构化数据评测:Veritas发布首个《数据基因指数》报告

3月18日,数据管理解决方案供应商Veritas发布该公司首份<数据基因指数>报告,为了进一步了解客户数据环境的真实结构,Veritas在2015年分析了来自众多客户非结构化数据环境的数百亿份文件及其属性.此次分析涵盖8000多种常见的文件类型扩展名.因此,报告中的数据基本能够代表客户文件系统环境的数据构成.与此同时,Veritas旨在探索全球数据发展趋势的数据基因项目(Data Genomics Project)也正式启动,该项目将建立一个数据科学家.行业专家以及思想领导者的的讨论社区,为信

做大数据领域的“福尔摩斯”,挖掘数据关系的真正价

众所周知,DT时代数据呈爆炸性增长,动辄达到数百TB甚至数十至数百PB规模的行业/企业大数据已远远超过了现有传统的计算机技术和信息系统的处理能力.因此,寻求有效的大数据处理技术.方法和手段已经成为现实世界的迫切需求. 对于企业来说,如何在大数据中淘金挖掘价值是最大的难题.面对数据量以及数据类型的复杂多变,挖掘工作越来越复杂,也越来越难以控制.对于新型大数据来说,哪个方向是重点,哪个分析是关键?为什么新型数据这么难以控制?针对企业来讲,究其根本的原因,是我们还没有找到数据与数据之间最重要,也是挖掘

数据爆炸时代 英特尔打算从这三个层次挖掘数据价值

3月31日消息,英特尔在北京举行2017中国战略分享会,全面阐述英特尔推出的数据战略,表示将从云.网络.人工智能,物和设备,加速技术三个层次推进数据战略进入良性循环. 英特尔公司全球副总裁兼中国区总裁杨旭表示,根据国家发改委的数据显示,中国在2020年将会拥有超过8000EB(1EB=1024PB,1PB=1024TB)的数据积累,成为世界第一数据资源大国,但是只有挖掘数据的价值,才能实现经济增值,促进消费升级.如何去挖掘数据价值,这就是英特尔要做的事情-端对端地处理数据. 英特尔将在既有的数据

《数据冰山报告》显示,管理数据越来越重要

Veritas发布<数据基因指数>之后,在近日又发布了<数据冰山报告>.<数据基因指数>报告发现了,40%以上的企业存储数据在三年内未曾修改,属于"过期"数据.而<数据冰山报告>显示,对企业没有价值的冗余.过期或者不重要的陈旧数据以及价值尚未明确的暗数据占据了企业数据存储的85%.企业IT领导层已经认识到数据囤积的问题. 有个成语是冰山一角,就是指暴露出来的跟隐藏的相比是很小的一部分.此次<数据冰山报告>指出85%的企业存储数

从商业视角理解数据:数据科学家的思维之路

在过去的几个月内,来自不同行业人不约而同问我能否提供一个端到端的视图,使他们了解成为一个数据科学家的思维过程.为这个问题寻找答案时,我想的不仅仅是提供一个端到端的视图过程,而是面对一个分析问题时我们应该更深入的了解他/她是怎么想的. 接下来我将分五个板块带领大家体验数据科学家的思维之路.文章的前半部分将介绍数据科学家如何进行任务的公式化建模以及数据点的工程化,这样可以为我们后续数据科学之旅提供规范和方向.我们还将深入了解整个生命周期中的另外两个重要因素,即探索性数据分析和特征工程.这些过程在制定

【C/C++学院】0826-文件重定向/键盘输入流/屏幕输出流/字符串输入输出/文件读写简单操作/字符文件读写二进制与文本差别/get与getline挖掘数据/二进制与文本差别/随机位置/多线程初级

文件重定向 #include<iostream> using namespace std; void main() { char str[30] = { 0 }; cin >> str; cout << str; system(str); cerr << "error for you"; cin.get(); cin.get(); } 键盘输入流 #include<iostream> #include <stdlib.h

挖掘数据价值vs确保隐私安全,可以同步

文章讲的是挖掘数据价值vs确保隐私安全,可以同步,"隐私"已经成为一个社会广泛关注的关键词,我们每天都在产生大量数据,很难做到把个人信息完全封闭起来,那么,在这样一个移动互联.大数据盛行的时代,怎样才能保护好个人隐私呢?首先我们需要了解的是什么样的数据可以称为隐私数据.你认为是隐私,他认为只是信息;于你而言强调保护,于他而言强调分享.按市场上通用的分法,我们一般将隐私数据分为个人信息.财产信息和隐私信息三种,前两者与人们的日常工作生活息息相关,而隐私信息则更为私密,诸如病史尤其精神病史

用友优普BA支撑迪罗电气挖掘数据金矿

随着互联网的发展,数据的价值愈加凸显,企业都在向数字化.数据驱动的方向发展.在互联网时代,数据驱动管理.运营.决策将成为企业的一大特征.在这一方面,互联网企业有互联网企业的优势,他们轻量,从创立之初就可以按照数字化企业去发展,去完成数据的积累;而传统意义上的传统企业也有着独到的优势:他们在长期经营管理过程中本身已经形成了一座数据金矿,只是很多还潜藏冰层之下,尚待挖掘. 但是如何挖掘自身数据金矿,让企业数据绽放魅力?这对于很多拥有庞大数据积累的企业而言是值得期待,却又无处着手的事.但迪罗电气这家"

《影响中国大数据产业进程100人》张华平:如何应用网络搜索挖掘内容价值

前言: 大数据是一个事关我国经济社会发展全局的战略性产业,大数据技术为社会经济活动提供决策依据,提高各个领域的运行效率,提升整个社会经济的集约化程度,对于我国经济发展转型具有重要的推动作用!2016年,由网加时代网.中国首席数据官联盟发起并主办,北京大学信息化与信息管理研究中心.中国新一代IT产业推进联盟协办的"影响中国大数据产业进程100人"大型人物专访活动全面启动,被采访对象均来自中国首席数据官联盟(分别为自政府.产.学.研.企各个领域),他们将从不同角度,不同层面向大家阐述当前大