DAS、NAS和SAN三种存储
对于存储来说,很多人依然停留在简单的硬盘、内存上,随着网络时代的快速发展,存储技术不断的更新,存储已经早就在硬盘技术为基础下得到飞速的发展。如今,企业级存储技术不断涌入市场,使得用户在专业术语认知上有所缺陷,如网络存储、虚拟存储、云存储、重复数据删除技术、归档技术等一大批术语究竟是什么,这些技术让人费解?
尽管掌握这些术语对于大多数人来说似乎没有实际意义,并不能真正意味着对于行业技术的熟悉,但是这些基本的存储术语,可以帮助想进一步深入了解企业存储技术的人获得入门知识。
说到数据存储,最先想到的一定是硬盘,因为在数据基本都存储在磁盘中,对于其数据保存起着一定的影响作用。而对于企业用户来说,服务器数据的存储相对更加重要,有些甚至决定着企业的命运。提及到这,随着企业网络应用中数据不断增加,网络存储技术的概念也随之出现。
DAS、NAS和SAN三种存储
首先,DAS(Direct Attached Storage,直接外挂存储)是存储方式的一种方案。这种存储方案的服务器结构如同PC机架构,外部数据存储设备(如磁盘阵列、光盘机、磁带机等)都直接挂接在服务器内部总线上,数据存储设备是整个服务器结构的一部分,同样服务器也担负着整个网络的数据存储职责。
此外,DAS还可以构成基于磁盘阵列的双机高可用系统,满足数据存储对高可用的要求。
其次,NAS(Network Attached Storage,网络附加存储)全面改进了以前低效的DAS存储方式,它是采用独立于PC服务器,单独为网络数据存储而开发的一种文件服务器。 NAS服务器中集中连接了所有的网络数据存储设备(如各种磁盘阵列、磁带、光盘机等),存储容量可以较好地扩展,同时由于这种网络存储方式是NAS服务器独立承担的,所以,对原来的网络服务器性能基本上没什么影响,以确保整个网络性能不受影响。
SAN(Storage Area Network,存储域网络)不是把所有的存储设备集中安装在一个专门的NAS服务器中,而是将这些存储设备单独通过光纤交换机连接起来,形成一个光纤通道的网络,然后这个网络再与企业现有局域网进行连接。
在这种方案中,起着核心作用的当然就是光纤交换机了,它的支撑技术就是光纤通道协议,这是ANSI为网络和通道I/O接口建立的一个标准集成,支持HIPPI,IPI,SCSI,IP,ATM等多种高级协议。在SAN中,数据以集中的方式进行存储,加强了数据的可管理性,同时适应于多操作系统下的数据共享同一存储池,降低了总拥有成本。
何为虚拟存储和云存储
何为虚拟存储和云存储
了解到存储基本方式后,你会更加清楚的认识到企业级产品中很多技术和产品都是围绕着这几个来展开的。如今最热门的莫过于虚拟化和云的技术概念,而存储上也很好的将这两个概念分别应用。
在技术层面上,很难具体把虚拟存储透彻的详解。但是,从通俗定义的角度上来说,虚拟存储就是将存储系统进行虚拟化。其实虚拟化技术并不是一件很新的技术,它的发展,应该说是随着计算机技术的发展而发展起来,既然虚拟存储技术由来已久,那如何理解如今热门虚拟存储应用?
从概念上比较通俗的理解,就是把多个硬盘、RAID通过一定手段集中管理起来,所有的存储模块在一个存储池中得到统一管理,这种可以将多种、多个存储设备统一管理起来,为使用者提供大容量、高数据传输性能的存储系统,就称之为虚拟存储。
此外,虚拟存储技术还可以通过管理软件,为网络系统提供一些其它有用功能,如简化服务器的远程镜像、Snapshot等应用。
云存储是受云计算影响
而谈及到云存储,受到云计算的影响,随着数据中心对云应用与需求增长,云计算数据中心落地也就产生了云存储。云存储应用的最新热潮是主存储的服务,最明显的应用范围是SAN和NAS。在这两种环境中,本地存储在主存储中扮演了云存储缓存的角色。随着数据的更新,其被复制到云中,这就类似于传统系统中快照复制的方式。数据的记录只在云副本中保存。这样使得应用或用户转向云存储区域,数据则复制回缓存由用户读取。
可能这还不够直观简单,可以说云存储是在云计算概念上衍生和发展出来的一种新的技术或者服务,云计算是将分布式处理、并行处理、网络计算相互结合,通过网络将计算机处理程序自动分拆成无数个较小的子程序再由多部服务器组成的庞大系统经计算分析之后将结果交回给用户。
而云存储则是将网络中各类存储设备通过应用软件集合起来协同工作,对外提供数据存储和业务访问功能的一个系统。云存储主要是由4层组成:包括存储层、基础管理层、应用接口层、访问层。
重复数据删除与归档技术
重复数据删除与归档技术
存储最终的目的是有效利用数据,不论是虚拟存储还是云存储,都需要结合很好的数据应用技术,有效的处理数据使其可以达到满足企业用户要求的效果。而存储上最大的工作是需要后期的备份,而数据重复情况不断扩大,如何通过这些数据进一步产生价值,提升企业业务能力增加效益是关键。
重复数据删除(Data Deduplication)就是一种数据缩减技术,旨在减少存储系统中使用的存储容量。依据数据处理方式的不同,重复数据删除技术可分成两种:其一是在线处理(In-line),这一方式中,数据在读进来之后,当存到磁盘之前就已经进行了重复数据删除;其二是后处理(Post-Processing),采用这一方式的话,数据在存到磁盘上后才会进行重复数据删除,在存到磁盘前,数据没有减少。
这两种方式各有优缺点:In-line的优势是节省了磁盘空间,同时重复数据删除一步到位,特别简单。但缺点是对CPU的损耗非常大,会占用大量CPU资源,导致性能下降。相比之下,Post-Processing对CPU的占用会小很多,但缺陷在于重复数据删除的环节会比较复杂。
然而数据量的爆炸性增长,所说的存储非简单的存和储的含义,而是涉及到备份、数据归档、数据保护、数据挖掘等等,而在这些存储范围之中,数据归档是最为常提及技术。
如何理解数据归档
对于数据归档,是指数据集合的一致性拷贝,通常用以长期持久地保存事务或者应用状态记录。一般情况下,数据归档通常用以审计和分析的目的,而不是用于应用恢复的目的,数据归档与备份都是数据存储的应用形式,只是应用目的不同。
备份是对数据进行复制,是为了确保在出现数据丢失或系统灾难时将复制的数据恢复回来,那么根据备份的解释再来看数据归档就很好理解了。数据归档是针对海量数据的应用,是对数据进行有计划的迁移。当数据停止改变或不被频繁使用时,通过数据归档把它们转移到别的地方,让出主存储空间,并且使之处于日常的备份窗口之外,既节约了空间,又提升了备份的效率。
那么根据上面的解释,如果再简化来说,那就是Ctrl+C和Ctrl+X的区别,备份是复制,数据归档是剪切。对企业而言,备份和数据归档具有两种不同但互补的功能:备份用于快速复制和恢复,以减少故障、人员错误或灾难带来的影响;数据归档则用于对数据进行有效的管理、保留和长期的访问与检索。