学习如何利用协同处理、非易失性存储器、互连和存储
要意识到缩小存取差距或使用协处理器将进程推进到 I/O 路径的潜在优势,突破设备技术要求系统设计师重新思考如何进行应用程序软件设计。探讨和考虑最新内存、计算设备、互联设备和子系统如何影响您的可扩展的、以数据为中心的、高性能云计算系统设备。设备技术中的突破被用于 “以计算为中心” 和更为平衡的 “以数据为中心” 的计算基础架构之间的转换。
作者调查了存储级内存,演示了如何填充 RAM 和旋转磁盘存储之间长期存在的性能差距,还详细介绍了 I/O 总线协处理器(处理相近的数据)的使用,说明了如何利用 InfiniBand 构建低成本高性能互连网络,并讨论了非结构化数据的可扩展存储。
计算系统工程历来都是由扩展处理器和动态 RAM (DRAM) 接口控制,以便进行内存工作,在数据驱动和计算算法之间留有一个巨大的间隙。人们对以数据为中心的计算兴趣正在快速增长,同新颖系统设计软件和硬件设备仪器一起支持大量数据集的数据变换。
专注于软件的数据毫无疑问是人们目前比较关注的应用程序,比如视频分析、传感器网络、社交网络、计算机视觉和增强现实、智能交通、机器对机器系统的大数据倡议,比如 IBM 的 智慧星球 和 智慧城市。
目前,引起人们关注的是关于收集、处理、转换和挖掘大数据集:
在非易失性存储器(存储级内存,SCM)中,数据焦点逐渐趋向于新的设备级突破,这使得大数据更需要进行处理。
与此同时,输入/输出协处理器使得处理更倾向于数据。
最后,InfiniBand 之类的低延迟、高带宽的现成互连支持研究人员快速构建 3D 圆环和胖树形集群,可用于限制最奇异和昂贵的自定义高性能计算 (HPC) 设计。
目前为止,系统软件,甚至系统设计仍然受到过时瓶颈和思想的影响。例如,考虑线程和多程序设计。整个理念源于慢磁盘驱动器访问;在等待数据时,程序除了运行另一个程序之外还能进行其他操作吗?当然可以,我们有独立磁盘冗余阵列 (RAID) 扩展和 NAND 闪存的固态磁盘 (SSD),但正如 IBM Almaden 研究表明的那样,存取时间间隙的时间尺度差异在人类语言中是巨大的。
对于每个设备来说,CPU、RAM 和存储之间的存取时间间隙能够以典型性能形式进行度量,但或许在采用人类语言时,间隙可能更容易理解(正如 IBM Almaden 为了便于说明而进行的研究所指出的那样)。
如果典型 CPU 操作类似于人类在数秒内所做的,那么 100 多倍的 RAM 存取延迟可能需要花费几分钟来访问信息。然而,经过类似比较,100 多倍延迟的磁盘存取与 RAM 相比大约是数月(100 天)。(参见图 1。)
图 1. 数据存取间隙
很多经验丰富的计算机工程师并没有认真思考过每秒进行 100 至 200 次随机 I/O 操作 (IOPS):这是磁盘驱动的机械边界。(当然,顺序存取每秒可高达数百兆字节,但是随机存取仍然和 50 多年前差不多,存在 15K RPM 搜寻和旋转访问延迟。)
最后,正如 Almaden 所指出的,磁带是极其缓慢的,就像冰川移动一样缓慢。既然如此,为什么我们还感到困惑呢?当然是因为容量。但是我们应该如何处理数据或者使数据处理更为高效?
我们再来看看图 1。用于移动设备的 NAND 快闪记忆体方面的改进以及更多近期 SSD 有助于缩小间隙;然而,人们普遍相信 NAND 闪存设备技术很快将到达极限,正如许多系统研究人员所指出的那样。使用的晶体管浮栅技术的应用已达到扩展极限,进一步扩展将会导致可靠性降低,所以,尽管这是一个权宜之计,以便使用进行以数据为中心的计算,但这可能并不是解决方案。
相反,几个新型非易失性 RAM (NVRAM) 设备技术可能是解决方案,这些设备技术包括:
相变 RAM (PCRAM):该内存使用一个加热元件将称为硫属化合物的材料变成一个结晶的或非结晶的玻璃态,从而存储两种可编程和读取的状态,即使不供电状态也能保持。对于 M 类同步非易失性存储器 (NVM),PCRAM 似乎兑现了近期的大部分承诺。
查看本栏目更多精彩内容:http://www.bianceng.cnhttp://www.bianceng.cn/Servers/cloud-computing/