《NoSQL权威指南》——2.4 多用户和硬件

2.4 多用户和硬件

列式模型的一个优势是,如果两个或更多的用户想使用列的不同子集,它们不需要彼此锁定。这种设计变得如此简单,是因为有了RAID(redundant array of independent disks,最初是redundant array of inexpensive disks)的磁盘存储方法,这种方法将多个磁盘驱动器结合到一个逻辑单元中。数据存储在几种称为级别的模式中,具有不同量的冗余。冗余的概念是,当一个驱动器发生故障时其他驱动器可以接管。当更换的磁盘驱动器放置在阵列中时,数据从阵列中的其他磁盘被复制,然后系统被恢复。下面是RAID的各种级别。

RAID 0(不带奇偶校验或镜像第块级带化)没有(或零)冗余。它提供了改进的性能和额外的存储,但没有容错。这是讨论的起点。
RAID 1(条带,无奇偶校验或镜像),数据相同地写入两个驱动器,从而产生一个镜像集;读请求是由包含被请求数据的两个驱动器中任意一个具有最小寻道时间和旋转延迟的驱动器进行响应。这也是Tandem不停机计算模型的模式。停止机器需要一个特殊的命令“Ambush”,这必须在同一个临界点捕获两个数据流,所以它们不会自动重新启动。
RAID 10(镜像和条带化),数据以条带化的方式写入主盘,并且在第二块磁盘上进行镜像。一个典型的RAID 10配置由4个驱动器组成:两个做条带化和两个做镜像。RAID10配置采取了RAID1和RAID0的最佳概念,并将两者结合起来。
在RAID 2(带有专用汉明码奇偶校验的位级带化)所有磁盘主轴的旋转是同步的,并且数据被条带化,所以每两个连续的位(数据存储单位)都分布在不同的驱动器。汉明码奇偶校验通过相应的字节计算并将其存储在至少一个奇偶驱动器中。这一RAID级别理论在实践中不使用。
在RAID 3(带有专用奇偶校验的字节级带化)所有磁盘主轴的旋转是同步的,并且数据被带化,所以每个字节按照顺序分布在不同的驱动器。奇偶校验是通过相应的字节计算并存储在专用的奇偶校验驱动器上。
RAID 4(奇偶校验的块级专用条带化)相当于RAID 5,知识奇偶校验数据被存储在一个驱动器上。在这样的安排中,文件可以在多个驱动器之间分布。每个驱动器独立运作,允许输入/输出(I/O)要求并行完成。对数据库而言,并行性是一个巨大的优势。每个会话可以访问一个不带锁的大量引用的表或读竞争(只读锁)的表。
RAID 5、RAID 6和其他存在的模式,这其中的许多都是市场营销多于技术。我们的目标是提供驱动器故障的容错,甚至n块磁盘驱动器故障或阵列损毁。这使得更大的RAID阵列具有实际价值,尤其是对高可用性系统。当然这对数据库人员来讲是非常好的,可以从并行查询中得到更多的好处。

时间: 2024-10-26 20:20:58

《NoSQL权威指南》——2.4 多用户和硬件的相关文章

《NoSQL权威指南》导读

引言 NoSQL权威指南"没有什么会比引入新秩序更难,因为创新者必须要面对那些在旧环境中已经做得很好的对手,以及那些在新环境中做得很好的冷漠者." --Niccolo Machiavelli [1] 在过去的几十年,我已经通过Elsevier/Morgan Kaufmann出版社出版了一系列的书,这些书几乎全部是关于SQL和RDBMS的.而这本书对行业媒体中所谓的大数据.新SQL或NoSQL(我们这些极客非常喜欢流行语)做了一些概述.第一个创造或挖掘了新名词的专栏作家或博主很可能会在维

《NoSQL权威指南》——第1章 NoSQL和事务处理

第1章 NoSQL和事务处理 NoSQL权威指南简介本章讨论传统的批处理和事务处理.将作业队列读入大型计算机仍然是商业数据处理大量采用的方式.事务处理模型通过使用新的ETL工具来加载数据库,完成批处理作业.我们需要了解批处理和事务处理这两种模型以及它们在新技术中如何使用. 早期的时候,计算机系统只能做单路处理,也就是说计算机只能从头开始按照顺序完成一项作业.后来,有了多处理技术,多个作业可以共享计算机资源,但每个作业仍相互独立并在硬件队列中等着轮到自己执行. 这种方式演化为一种事务模型,并成为S

《NoSQL权威指南》——第2章 列式数据库

第2章 列式数据库 NoSQL权威指南简介从打孔卡和磁带的年代开始,文件就是物理设备上连续的字节,访问的方式是从文件开始(打开文件)到文件结束(文件结束的标志为TRUE).是的,存储可以在磁盘上被分割成数据页,并且各种数据页可以通过指针链连接,但这种模型仍然与前面提到的打孔卡.磁带是相同的.后来,文件被拆分成记录(record,更多物理连续的字节),记录又被拆分成字段(field,仍然是更多物理连续的字节). 文件被一条记录一条记录地处理(读/取一条,然后下一条)或按照物理存储位置顺序地处理(从

《NoSQL权威指南》——1.5 CAP定理

1.5 CAP定理 2000年,Eric Brewer在ACM分布式计算原理主题研讨会做了主题演讲,并介绍了CAP定理(也称Brewer定理).2002年,在麻省理工学院的Seth Gilbert和Nancy Lynch的努力下进行了修订和修改,后来又有很多人参与. 这个定理是针对分布式计算系统的,而传统并发模型会假设有中央并发管理机制.悲观并发模型有一个"交通警察",乐观并发模型有一个"服务领班".CAP代表一致性(consistency).可用性(availab

《NoSQL权威指南》——1.3 ACID

1.3 ACID 已故的Jim Gray [2]在20世纪70年代才真正发明了现代事务处理,并在1981年6月写入经典论文"事务概念:优点和限制"(The Transaction Concept: Virtues and Limitations).从这篇论文开始,有了ACID(原子性.一致性.隔离性和持久性)这个缩写词.Gray的论文论述了原子性.一致性.持久性,隔离性是后来补充的.Bruce Lindsay和他的同事于1979年在Gray的论文的基础上写了论文"分布式数据库

《NoSQL权威指南》——1.8 错误处理

1.8 错误处理 错误信息有两大类,我们可以遇到一些预料之中的问题,如无效密码,针对这些情况可以采用标准的响应或处理过程.假如我们忘记了正确的密码,并且在做多次尝试后仍不能使用正确的密码,就会被锁定. 第二类错误消息能告诉我们发生了什么事,可能会有使人厌烦的细节.这些信息会让用户进行一些处理操作或者让用户知道他为什么会失败. 但是有了NoSQL的发展和最终一致性模型的出现,事情也未必就会变得很舒服.系统还是会停止或锁定,不知道是为什么,可以做什么,或者需要多长时间来解决(如果能解决的话).截至2

《NoSQL权威指南》——2.6 数据仓库和列式数据库

2.6 数据仓库和列式数据库 当只涉及少数列时,数据仓库可以将部分工作负载转移到列式数据库,以提高性能.多维数据库(Multidimensional database,MDB)或多维数据集(cube)是支持非常快速访问预先计算的汇总数据的不同的物理结构.当查询请求MDB大部分列的情况下,MDB将执行相当不错. 这些MDB数据库的物理存储是一个规范化的维度模型,通过存储计算结果消除了连接(join)操作.然而,随着列的增加,MDB会变得巨大,并且增长速度会比预期快.MDB中的数据可以使用与列式数据

《NoSQL权威指南》——1.4 悲观并发详解

1.4 悲观并发详解 悲观并发控制假定冲突是预料之中的情况,必须警惕.在关系数据库管理系统(relational database management system,RDBMS)中最流行的模型是基于加锁的.锁是一种允许一个用户会话对资源的访问同时保持或限制其他会话对同一资源的访问的装置.每个会话可以针对资源获得对应的锁,对资源进行修改,然后在数据库中提交(COMMIT)或回滚(ROLLBACK)相应的操作.COMMIT语句将修改持久保存,ROLLBACK语句将数据库恢复到会话之前的状态.如果修

《NoSQL权威指南》——2.1 列式数据库的历史

2.1 列式数据库的历史 列式存储以及倒排或不按顺序存储文件的方式并不是最新提出的.TAXIR是1969年为生物学建立的第一个列式数据库存储系统.加拿大统计局于1976年实现了RAPID系统,并将其用于加拿大人口和住房普查数据的处理和检索,以及其他与统计相关的一些应用.RAPID被拿来与世界各地的其他统计机构共享,并在20世纪80年代被广泛使用.直到20世纪90年代,它一直被加拿大统计局使用. 多年来,Sybase IQ是市面上唯一一个可以商用的列式DBMS.然而,当OLAP(online an