大数据系列之大数据分析如何权衡存储

文章讲的是大数据系列之大数据分析如何权衡存储, 系列1:未来24个月市场趋势和IT投入重点

  系列2:大数据分析对IT资源的需求

  在之前的系列1和2中,我们已就大数据分析的发展趋势以及对IT资源的需求进行了解析。接下来,针对大数据分析的重要一环—存储,中桥将结合市场热门的存储技术如闪存、固态盘等,来从存储性能、数据保护等角度进行分析。

  通过前文的相关数据分析,我们已经了解到,随着大数据时代应用数量、应用数据量和使用者数量的增长,系统对存储IOPS以及OLTP和OLAP的要求越来越高。传统存储也越来越无法满足业务关键应用的性能需求,这驱动了中国企业未来24个月新存储的部署。而固态盘、闪存技术作为新型存储,已经得到越来越多的企业的青睐。中桥的调查数据也验证了这一点。企业采用固态盘或闪存技术的主要原因排列如下:提高桌面虚拟化的性能、提高OLAP性能需求、满足业务关键应用性能和低延迟要求、提高虚机密度应用性能等。而桌面虚拟化、OLAP高要求、业务关键应用、低延迟以及高虚拟机密度也正是大数据时代的典型特点。


▲图1. 选择固态盘或闪存技术的主要原因

  那么对于中国企业而言,所选择的新型存储技术应该以什么样的指标来权衡,才能确保整个大数据分析流程平稳、高效运行?中桥对企业的调查结果显示(图2),存储高可扩展性、高可用性和并行处理能力是企业评估大数据存储最重要的三个因素。高可扩展性可以确保企业的IT能够随着数据量的增长和性能需求进行扩展,以满足海量数据的存储和处理需求;高可用性则能够保证大数据分析过程的平稳、无间断运行,确保了业务连续性;高并行处理能力则能够确保在大数据处理过程中同时进行更多数据的处理,高效地完成数据分析,从而将分析结果转化为业务决策,加快产品或技术的面市周期。此外,低延迟、自动分层存储以及10GbE支持等也是用户评估大数据存储的重要考核因素。


▲图2 . 评估数据分析存储技术的重要指标

  我们再换一个角度来继续解读一下存储。众所周知,不同类型的数据,其生命周期也是不同的,而根据数据类型和生命周期来进行存储资源分配,则能够有效提高存储利用率,这对于大数据的存储开支非常关键。此外,数据的有效管理也决定着生产应用的性能。中桥调查结果显示(图3),大量中国用户所采用的数据库面临着性能压力(84.4%),且没能有效地进行数据的归档和清理,其中,24.6%的受访企业甚至不进行数据归档和清理,还有高达34.9%的受访企业采取手动方式来进行数据归档和清理。将非活跃数据从主存储资源上清理出来,并根据数据类型和生命周期进行分层存储和归档,尽可能提高存储利用率的同时,还能够确保生产应用性能的稳定性,为数据分析提供所需的性能,有效降低主存储开支,延缓存储采购周期。


▲图3. 数据的归档和清理

  在大数据时代,海量数据给企业带来的不仅仅是系统性能和存储难题,数据保护也是企业的一大焦点。中桥调研结果显示(图4),用户就面临的数据保护挑战排列如下:“数据备份影响业务性能”(25.1%)、“数据保护网络带宽需求大”(20.7%)、“分级存储读写性能不能满足要求”(19.3%)。这表明,在大数据时代,海量数据的备份和保护以及分级存储,将对业务性能带来很大影响,包括对网络带宽的影响。这也从侧面再一次表明数据的分级存储对企业的重要性。


▲图4大数据数据保护的最大挑战

  数据是大数据时代通过IT创造价值的“种子”。在大数据分析的四个重要环节中——数据采集和存储、数据清理和整合、数据分析、分析呈现——满足大数据演进过程中对容量、性能和业务连续性的需求,提升资源利用率降低存储开支,不仅能保护好大数据这个“种子”,也是选择大数据存储的重要考虑因素。

作者: 蔡思萌

来源:IT168

原文链接:大数据系列之大数据分析如何权衡存储

时间: 2024-10-25 22:34:42

大数据系列之大数据分析如何权衡存储的相关文章

大数据系列之大数据分析对IT资源的需求

文章讲的是大数据系列之大数据分析对IT资源的需求, 为了准确描述中国大数据市场和技术发展趋势,解析大数据发展的各阶段对IT技术的需求,2013年6月,中桥调研咨询(以下简称中桥)对中国480家最终用户的IT管理者和专业人员,就大数据市场和技术发展趋势展开了调查.中桥首席分析师王丛结合其在欧美数据中心领域十几年的市场调研积累,对中国大数据市场趋势的调查数据进行解析,以诠释中国大数据市场和技术趋势.同时,会通过在线讲座(www.webinars-china.com )和中国读者解读中国大数据市场趋势

微软发布大数据愿景 推动数据分析平民化

当其他厂商还更多地将注意力放在"如何利用大数据进行产业转型和企业创新"时,微软已经开始展示如何利用正确的技术和工具,让每位普通大众都能从大数据中直观获取洞察. 10月18日,微软全球高级副总裁.大中华区董事长兼首席执行官贺乐斌在"大数据媒体日"上对记者表示,"与其他公司处理大数据的方式不同,微软主张从发现数据.分析数据和对数据进行可视化的处理这三种方式来思考大数据的使用.微软大数据愿景是,希望基于标准化的产品,使所有人都能够在任何时间任何地点利用数据,并更

解读2015之大数据篇:大数据的黄金时代

2015年,整个IT技术领域发生了许多深刻而又复杂的变化,InfoQ策划了"解读2015"年终技术盘点系列文章,希望能够给读者清晰地梳理出技术领域在这一年的发展变化,回顾过去,继续前行. 本文是大数据解读篇,在这篇文章里我们将回顾2015展望2016,看看过去的一年里广受关注的技术有哪些进展,了解下数据科学家这个职业的火热.在关键技术进展部分我们在大数据生态圈众多技术中选取了Hadoop.Spark.Elasticsearch和Apache Kylin四个点,分别请了四位专家:Hulu

将大数据转化为大价值实用战略

当今,一些最成功的公司通过捕捉.分析和利用大量各式各样.快速移动的"大数据"获得了强大的业务优势.本文介绍了三种使用模型,可帮助您实施灵活.高效的大数据基础设施,以获得自身业务的竞争优势.本文还描述了英特尔在芯片.系统和软件领域的多项创新,可帮助您以最佳的性能.成本和能效来部署这些和其他大数据解决方案. 大数据机遇 人们常将大数据比作海啸.当前,全球五十亿手机用户和近十亿的 Facebook* 与 Skype*用户正在生成规模空前的数据,而这些用户只占全球网民人数的一小部分.英特尔估计

2013年展望:大数据发展十大趋势分析

本文讲的是2013年展望:大数据发展十大趋势分析,2012年大数据发展如火如荼,大有赶超云计算之势.如果把今年比作大数据落地生根的一年,那么2013年将迎来其茁壮成长,甚至开花结果的一年.有预测称,大数据市场将以每年40%的速度增长,2012年大数据市场规模约为50亿美元,2013年将翻倍.2013年大数据发展有哪些新趋势呢?不管是IDC.Gartner还是国内大数据研究机构都给出了各自的答案,笔者在这里总结一下各方观点,并谈谈自己的想法. 预测1:开源大数据商业化 随着闭源软件在数据分析领域的

10分钟让你明白大数据 网友观点大拆解

文章讲的是10分钟让你明白大数据 网友观点大拆解,大数据的概念被吵的越来越厉害,这对于一个新技术领域的诞生是一个必经过程.对于"大数据"(Big Data),研究机构Gartner给出的定义是:"大数据"是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力的海量.高增长率和多样化的信息资产. 两年前,<纽约时报>撰文"欢迎大数据的到来",两年后,大数据的商业价值已经显现.在各个行业,我们都已能看到大数据的身影.网友关于大数据

中国计算机报郭涛:大数据不是大谎言

近期的美国<福布斯>杂志刊发了一篇题为<大数据是个大谎言>的署名文章,文章作者SAP Sybase全球CTO伊尔凡·汗给那些大数据的拥趸泼了一盆凉水.云计算市场还在持续升温,随之而起http://www.aliyun.com/zixun/aggregation/14294.html">的大数据掀起的热潮相比云计算来讲有过之而无不及. 按照伊尔凡·汗的说法,从数据库到数据仓库再到今天的大数据,数据量的 快速增长是一个趋势,而与之相对应的数据处理的方式也在变化.提高,这

工业大数据的3大来源、3大关键问题、2个实施案例

2011年麦肯锡全球研究院大数据报告表明,2009年美国以装备制造为代表的离散工业领域拥有的数据规模为各领域之首,比美国政府拥有的数据还要多.近年来,随着德国工业4.0和美国工业互联网为代表的新工业革命深入发展,以及"中国制造2025"."互联网+"行动计划与"促进大数据发展行动纲要"的颁布实施,工业大数据得到了越来越多的关注.这里分享一下我们的思考与实践. 1.工业大数据三大来源 企业信息系统.装备物联网和企业外部互联网是工业大数据的三大来源:

《Hadoop与大数据挖掘》——第一篇 基 础 篇 第1章 浅谈大数据 1.1 大数据概述

第一篇 基 础 篇 第1章 浅谈大数据 当你早上起床,拿起牙刷刷牙,你是否会想到从拿起牙刷到刷完牙的整个过程中有多少细胞参与其中?这些细胞在参与的过程中会结合周围环境(可能是宏观的天气.温度.气压等,可能是微观的分子.空气中的微生物等),由你的意识控制而产生不同的反映.如果我说结合这些所有的信息,可以预测你接下来的0.000 000 01秒的动作,那么,你肯定说,这我也可以预测呀.比如正常情况下,你脚抬起来走路,那么抬起来后,肯定是要落下去的,这算哪门子预测呢?那如果我说可以预测你接下来一个小时