对象级存储正准备替代企业中的NAS

NAS文件服务器或文件管理器在过去的25年里一直是存储非结构化数据或非标准数据库数据的传统方式。面向非结构化数据,并不意味着数据本身没有结构,因为文件本质上就是一个二进制对象。基于以上原理,许多供应商已经为相同的非结构化数据同时提供对象级存储和文件级存储接口,我们有望看到新兴的对象存储成为传统文件服务器的替代者。

我们将在这篇文章中讨论混合使用对象级存储和文件存储两种方式来存储非结构化数据时的优劣对比,并研究IT部门在考察相关产品时应该考虑哪些重点。

NAS历史回顾

NAS涵盖了源自IT世界两段不同历史的两种技术。其一是由Sun Microsystems开发的NFS,已经成为非Windows系统访问网络文件内容的标准协议。另一种就是SMB,也就是广为人知CIFS,是Microsoft平台的文件共享协议。两种技术自从推出以来都发展迅速,不断提升和增加扩展功能,超越简单文件共享实现更广泛的功能。

传统的NAS会使用RAID技术来防护磁盘故障,供应商的大多数NAS产品也都基于双控制器架构来防护硬件故障,其中一些NAS产品还能实现横向扩展。NAS的文件系统首先构建在物理存储介质上,这些文件系统再使用NFS或SMB向网络公开。

NAS和对象存储的相似点

基于文件的NAS和基于对象的存储都面向相同的数据类型——非结构化文件,在文件内部或者外部维护文件层级信息。两者都可以支持横向扩展架构,从而能存储海量文件或对象。

用文件系统来充当数据存储基础也带来一些可用性问题:

可扩展性问题。在单节点NAS或故障转移双节点NAS上,文件系统只位于单个操作系统实例上。这种方式可以相对容易地处理诸如文件创建、锁定和更新的“固定模式”操作。然而,文件系统的扩展是一个真正的挑战,并且问题在需要处理众多节点变得非常复杂。

数据完整性。文件系统将数据分解为元数据和数据内容,然后存储在逻辑或物理磁盘卷空间内。如果文件服务器意外掉电,那么系统必须执行文件系统检查(FSCK)来校验掉电时数据的完整性。根据文件系统的实现方式,校验操作可能会带来很大的延迟;某些NAS系统,如NetApp的Data ONTAP,会使用非易失性RAM来处理海量数据的校验和确认,从而降低FSCK的开销。

RAID保护。从Gatter Gibson和Randy Katz在1987年的一篇论文开始,RAID已成为存储设备的常规保护措施。RAID技术为我们服务了很多年,但现在已经开始达到可扩展性的极限,因为硬盘驱动器的容量不断增长,结果已经远远超出RAID论文发表时的预计。今天的RAID系统重建时间可能会持续数天,这已经是个大问题,随着新款12TB容量驱动器的发布和不断投入使用,RAID的前景将会更加困难。

RAID仅适用于保护存储在单个设备中的数据,这也是额外的限制条件。为了保护数据免受单纯设备故障之外的侵害,必须对数据进行复制,在地理上分散的不同位置创建数据的完整副本。

理解对象存储

基于对象的存储是存储二进制数据或对象的相对较新的方式。该技术可以追溯到20世纪90年代中期,一家名为FilePool的公司提出了可寻址内容存储的概念。EMC(现在的戴尔EMC)收购了FilePool,其产品成为Centera产品线。此后,许多供应商都已经进入这个可以存储海量非结构化内容的新概念市场。

NAS产品基于文件系统存储非结构化数据,这种机制的性能和数据完整性缺陷无法避免;而对象存储是一套物理存储架构,完全消除了以上问题。这是因为对象存储并不使用文件系统概念,而是将数据存储在单个平面命名空间或层次结构中。

对象级存储在以下几个关键领域与NAS不同:

通过基于Web的协议(HTTP或HTTPS)访问,而且通常是无状态连接。对象存储平台的每次读写操作都使用诸如store-create,update和delete这样的简单指令。

没有文件目录结构。对象级存储提供“存储单元”或逻辑存储容器,以平坦,非分层的方式存储数据。

不关注数据格式或结构。数据的内容属性描述信息会保存在元数据中,和数据本身同时存储。这些属性可以是系统元数据,例如数据保存的日期时间,或用户定义的元数据,从而让外部应用程序更容易对数据内容执行检索和搜索。

修改操作不改变旧数据。新数据对象的存储是一个无关联的操作,而数据对象的修改更新实际上包括删除和创建操作,并不会实际修改已有数据。

广受认同的对象存储的高度可扩展性。许多IT公司认为,如果没有存储海量二进制数据的需求,就没有必要选择对象存储。这种偏见正在消除,对象存储适合任何环境,而不只是超大规模的云。

通过可替代RAID的技术措施实现数据保护。这些技术包括保留对象的多个本地或远程副本,或者使用擦除编码。

使用特殊的内容锁定技术。内容锁定可以保障NAS的数据完整性。单独的文件可以打开以进行独占或写入访问,确保数据只能在任何一个时间被单个来源编写。对象存储并不提供原生的锁定功能,但会确保对象被视为不可变的,这意味着数据会被覆盖以保持一致性。

毫无疑问,对象和文件存储之间的界限有些模糊。

对比两种存储系统的属性,我们可以看到存储数据的两种方法之间也有很多相似之处。两者都适用于非结构化数据,并使用元数据来跟踪正在存储的特定对象的信息。可以看出,改造对象存储以提供NAS协议并不困难。

合并对象和NAS存储

为什么要合并NAS和对象存储?除了只需运行单个存储平台带来的物理存储的明显节省外,还有其他好处:

对象存储器使用擦除编码技术来支持位置分散的数据的保护和访问。这意味着不再需要使用传统复制技术来保留数据的整个副本。存储硬件节省效果显著,但还有其他好处,例如能够有效地将数据访问扩展到多个位置,而不是点对点性质的复制。提醒一句:地理分布文件的锁定——实现有效的、分布式对象的关键要素——并不简单。

对象存储器使用擦除编码技术来支持位置分散的数据的保护和访问。这意味着不再需要使用传统复制技术来保留数据的整个副本。存储硬件节省效果显著,但还有其他好处,例如能够有效地将数据访问扩展到多个位置,而不是点对点性质的复制。提醒一句:地理分布文件的锁定——实现有效的、分布式对象的关键要素——并不简单。

可以同时从使用多个协议的不同系统上访问数据。对象存储既可以通过传统协议(如NFS或SMB)提供内容服务,需要时也可以使用更有效的基于对象的访问方式来分析数据内容,以支持其他目的。与NAS相比,对象协议的无状态特性减少了访问内容的开销,例如文件锁定或跟踪,分配锁和跟踪打开的文件句柄(请参阅“减少开销”)。

对象存储介质易于扩展而且便宜。在提供传统文件访问功能的同时,对象存储也是归档存储的理想选择。您还可以将数据移动到云端对象存储,包括长期冷数据归档,同时还能保留一定限度的元数据实现内容检索。这种混合使用物理和云存储资源的方法大大简化了混合存储平台的开发。

基于对象的NAS:供应商评述

有哪些供应商提供基于对象的NAS产品?我们看到有两种不同类型的产品诞生:利用基于对象的NAS来提升NAS使用体验,而且无需暴露底层对象存储;或者,供应商提供混合的NAS和对象功能,数据通过两种协议都可以访问。

基于对象的NAS产品模式的例子包括Nasuni,这是一个提供基于云的全局NAS产品的初创公司,NAS的后端存储空间则基于Amazon Web Services Simple Storage Service(亚马逊Web服务简单存储服务)。另外一家采用类似技术的公司是Exablox(现在属于StorageCraft公司)。该公司的横向扩展OneBlox系统使用环行分布式对象存储来保存文件内容,同时提供一些有意思的功能,如智能文件版本控制和快照。OneBlox底层会对象分解成允许重复数据删除的块,但这些细节用户无法访问。

在商业对象存储软件领域也有一系列专有供应商产品。以下是一些例子:

Scality公司的RING产品,提供SMB 2.0和NFSv3支持,包括与Microsoft Active Directory的集成。多协议的支持通过在RING平台本机运行的不同协议“连接器”服务来实现。

Caringo公司的Filefly产品,使用后台文件服务来扩展公司的Swarm对象存储,从而支持NAS协议。该公司还提供轻量级接口SwarmNFS,可以利用NFSv4版本协议访问Swarm对象存储中存储的数据。

DataDirect Networks公司,在其WOS对象存储产品中提供名为NoFS的功能,让您可以使用文件服务。该公司宣称,使用NoFS可以比传统文件服务系统节省15%至20%的存储空间,并显著减少I/O流量冲击。

Hitachi Data Systems通过HCP Anywhere在该公司的Hitachi Content Platform对象存储平台上实现NAS访问。使用定制开发的HCP Anywhere应用程序让数据内容可以被移动设备访问。

Cloudian公司,使用HyperStore Connect for Files实现对其HyperStore对象平台的文件访问。该产品提供无状态接入点,从而提供包括全局命名空间和文件锁定的标准NAS功能。

除了提供原生NAS支持的对象存储供应商之外,还有一些公司提供可以连接到对象存储的文件网关,例如Avere公司的FXT产品。然而,这些非原生产品不能同时通过NAS和对象两种协议访问数据,因为数据可能会用专有格式存储到后端对象存储,不可能直接从对象级别访问。

最后我们也应该提到可供选择的开源产品。Ceph基于支持对象、文件和块格式的横向扩展平台来实现对象存储功能,尽管当前它还不支持直接通过多个协议暴露相同的数据。还有OpenIO,它支持一系列存储协议,并且可以部署在普通商品硬件上。支持的硬件还包括基于ARM的硬件,该公司使用名为“nano”的ARM节点可以将独立的硬盘驱动器转换为存储服务器。

数据分析的伙伴

对象和文件是数据分析的好伙伴。使用传统的NAS协议存储数据,使用对象或HTTP进行后端分析,这种组合可以将并行的两种业务的开销和相互影响降到最低。对象协议不需要文件锁定和其他数据完整性功能,因为数据的读写都是静态的。这就减少了文件系统的开销并提高了性能。

毫无疑问,对象和文件存储之间的界限是模糊的,对于很多用例来说,合并这两者合情合理。对象级存储提供了比传统NAS存储更实用的存储方法,具有更高的效率和地理灵活性。我们可以预计,未来所有非结构化存储设备都会原生地同时支持标准的对象和文件两种协议。

作者:Chris Evans

来源:51CTO

时间: 2024-10-02 18:03:18

对象级存储正准备替代企业中的NAS的相关文章

浅析私有存储云在企业中优势与安全性

文章讲的是浅析私有存储云在企业中优势与安全性,随着数据不断以指数形式增加,人们已经不可能降低数据的存储量,因此,多数企业为了提高系统效率,对已有基础设施进行日常维护和升级,以及对现有的基础架构引用动态架构技术,以提高可伸缩性.这包括将服务器和存储技术混合.非破坏性地添加和移除存储设备以及随需应变;在不宕机的情况下转移数据的能力;提供多层次业务服务的能力,以在整个企业内部满足可用性或者合规性的要求. 实现这些目标需要一个灵活.易扩展.易管理的存储技术.对于很多企业来说,私有存储云就是解决发,通过对

德驻华大使:德国正讨论立法限制中企并购德高科技企业

11月29日,德国商会在京举行新闻发布会,公布<2016年德国在华企业商业信心调查报告>.据路透社消息,德国驻华大使柯慕贤在发布会上透露,德国政府正在讨论是否立法限制中国企业并购德国高科技企业.德驻华大使:德国正讨论立法限制中企并购德高科技企业 根据德国现行法律,只要收购危及能源安全.国防或金融稳定,政府就能加以阻止.但近期中国企业针对德国高科技企业的收购案激增,德国政府正在讨论出于国家安全的考虑,是否应增加对此类并购的限制. 柯慕贤称,"目前德国的法律只是限制可能危及国家安全的并购

WIN2008 R2 Active Directory 之一 部署企业中第一台Windows Server 2008 R2域控制器_win服务器

前言 对于活动目录(AD)来讲,从Windows 2000到现在有非常多的文章在对其进行探讨,微软公司每推出一代新的Windows系统,这一重要服务技术不管是从功能上还是从性能上都在不断进步.在此,以最新Windows Server 2008 R2(以后简称WIN08R2)系统为例,从零开始讲述关于WIN08R2活动目录相关技术.希望能一直坚持写完! --胖哥 通过多年来AD在企业中的部署,技术人员几乎都知道与活动目录相关的一系列概念了,如:域.域树.域林.OU和站点,还有域控制器(DC)等.那

艾伟也谈项目管理,克服在企业中应用敏捷方法的技术挑战

在企业中应用敏捷方法是一项具有挑战性的任务.实现敏捷不像安装软件那样能在一天内完成.而是需要适应企业环境,其中包括:文化.技术和组织方面.本文将探讨面临的一些挑战,这些挑战与建立开发环境.自动化测试.持续集成相关,并且同在企业环境中明确完成的定义(DoD)相关. 建立开发环境 每位技术负责人和开发经理都想缩减团队成员建立开发环境的时间.然而,为了在项目中获得较高的产出,开发人员要持续投入许多精力,让事情变得有条不紊.缺乏文档,是建立开发环境时间过长的关键原因.第二个关键原因是建立过程中包含多少手

云存储正寻求突破

本文讲的是云存储正寻求突破,[IT168 资讯]"现在,我们正处在一个重大的变革期,整个IT界正在从以设备/应用程序为中心转向以信息为中心,而这一转变还将引发一系列的变革,并影响到技术和业务模式两个层面."在EMC中国研发中心举办的首个"创新日"上,EMC中国研发中心总架构师任翔宇表示.任翔宇认为,云存储的最大特点是海量.高性能/高访问量以及低成本,而其带来的最大变革是,提供商逐渐从销售工具转向根据工具的实际使用收费,也就是从卖产品转向了卖服务. 云存储的业务模式有

杨凯:大数据在制造企业中的核心应用

我个人经过近几年与客户交流或者是参与各种研讨活动,"大数据"的热度逐年攀升.那对于制造企业来说,大数据,到底怎么应用,目前也是众说纷纭.今天利用这篇文章,来说说我的见解. "德国工业4.0"中明确表示"工业4.0就是大数据驱动的智能制造,所有的生产装备.感知设备.联网终端,包括生产者本身都在源源不断地产生数据,这些数据将会渗透到企业运营.价值链乃至产品的整个生命周期".在<中国制造2025>中也提到了"工业企业中生产线处于高

首席数据官正走出阴影冲向企业前线

首席数据官(CDO)正在迅速摆脱后台数据质量和治理任务的阴影,走到企业计算战略的前线. 这个趋势正在变得越来越明显,特别是本周四Gartner新研究报告的发布,以及CDO们在一年一度麻省理工学院CDO和信息质量研讨会上分享的故事. 财富500强企业中的CDO人数已经从5年前的寥寥无几,增加到今天的300多人,但是到目前为止CDO的角色都不符合传统的定义.Gartner研究发现,CDO大多来自于广泛的背景和行业,没有标准的技能或者经验水平. 例如,在Gartner的CDO调查中有近30%的受访者是

WIN2008 R2 Active Directory 之二 部署企业中Windows Server 2008 R2额外域控制器_win服务器

题外话--谨以此文纪念"痛苦"的交规考试以98分通过.小弟准备考驾照,最近被交规,就把博文之事放下了.哈哈哈,今天刚一通过就马上来码字儿了!  通过<部署企业中第一台Windows Server 2008 R2域控制器>(http://www.jb51.net/article/38401.htm)已经完成了企业中Windows网络域森林的建立.但是,在企业中对于AD来讲,为了保证安全稳定运行,至少需要两台以上的物理域控制器. 在早期的Windows中可以部署备份域控制器(B

摩卡软件知行易强势登场,用游戏化掌管你企业中的“右”脑

中介交易 SEO诊断 淘宝客 云主机 技术大厅 你的团队是否在你的掌控之中?看到这个问题,你一定会脱口而出肯定的答案,但仔细想想,真的是这样吗? 作为企业老板,尤其是中小企业老板,在管理中最重要的需求之一就是提高员工的工作效率和质量,而提高员工的工作效率与质量最重要的因素在于激发他们的自驱动力.著名管理学家.趋势学家丹尼尔·平克(Daniel H. Pink)在其著作<驱动力>中指出:"没有哪一种力量比人们自发的驱动力更能产生创造力和持久的高效率." 你通过什么来衡量你掌握