如何利用云扩展协同处理、非易失性存储器互连和存储

设备技术中的突破被用于 “以计算为中心” 和更为平衡的 “以数据为中心” 的计算基础架构之间的转换。 作者调查了存储级内存,演示了如何填充 RAM 和旋转磁盘存储之间长期存在的性能差距,还详细介绍了 I/O 总线协处理器(处理相近的数据)的使用,说明了如何利用 InfiniBand 构建低成本高性能互连网络,并讨论了非结构化数据的可扩展存储。

计算系统工程历来都是由扩展处理器和动态 RAM (DRAM) 接口控制,以便进行内存工作,在数据驱动和计算算法之间留有一个巨大的间隙。人们对以数据为中心的计算兴趣正在快速增长,同新颖系统设计软件和硬件设备仪器一起支持大量数据集的数据变换。

专注于软件的数据毫无疑问是人们目前比较关注的应用程序,比如视频分析、传感器网络、社交网络、计算机视觉和增强现实、智能交通、机器对机器系统的大数据倡议,比如 IBM 的 智慧星球 和 智慧城市。

目前,引起人们关注的是关于收集、处理、转换和挖掘大数据集:

在非易失性存储器(存储级内存,SCM)中,数据焦点逐渐趋向于新的设备级突破,这使得大数据更需要进行处理。 与此同时,输入/输出协处理器使得处理更倾向于数据。 最后,InfiniBand 之类的低延迟、高带宽的现成互连支持研究人员快速构建 3D 圆环和胖树形集群,可用于限制最奇异和昂贵的自定义高性能计算 (HPC) 设计。

目前为止,系统软件,甚至系统设计仍然受到过时瓶颈和思想的影响。例如,考虑线程和多程序设计。整个理念源于慢磁盘驱动器访问;在等待数据时,程序除了运行另一个程序之外还能进行其他操作吗?当然可以,我们有独立磁盘冗余阵列 (RAID) 扩展和 NAND 闪存的固态磁盘 (SSD),但正如 IBM Almaden 研究表明的那样,存取时间间隙的时间尺度差异在人类语言中是巨大的。

对于每个设备来说,CPU、RAM 和存储之间的存取时间间隙能够以典型性能形式进行度量,但或许在采用人类语言时,间隙可能更容易理解(正如 IBM Almaden 为了便于说明而进行的研究所指出的那样)。

如果典型 CPU 操作类似于人类在数秒内所做的,那么 100 多倍的 RAM 存取延迟可能需要花费几分钟来访问信息。然而,经过类似比较,100 多倍延迟的磁盘存取与 RAM 相比大约是数月(100 天)。(参见图 1。)

图 1. 数据存取间隙

很多经验丰富的计算机工程师并没有认真思考过每秒进行 100 至 200 次随机 I/O 操作 (IOPS):这是磁盘驱动的机械边界。(当然,顺序存取每秒可高达数百兆字节,但是随机存取仍然和 50 多年前差不多,存在 15K RPM 搜寻和旋转访问延迟。)

最后,正如 Almaden 所指出的,磁带是极其缓慢的,就像冰川移动一样缓慢。既然如此,为什么我们还感到困惑呢?当然是因为容量。但是我们应该如何处理数据或者使数据处理更为高效?

我们再来看看图 1。用于移动设备的 NAND 快闪记忆体方面的改进以及更多近期 SSD 有助于缩小间隙;然而,人们普遍相信 NAND 闪存设备技术很快将到达极限,正如许多系统研究人员所指出的那样。使用的晶体管浮栅技术的应用已达到扩展极限,进一步扩展将会导致可靠性降低,所以,尽管这是一个权宜之计,以便使用进行以数据为中心的计算,但这可能并不是解决方案。

相反,几个新型非易失性 RAM (NVRAM) 设备技术可能是解决方案,这些设备技术包括:

相变 RAM (PCRAM):该内存使用一个加热元件将称为硫属化合物的材料变成一个结晶的或非结晶的玻璃态,从而存储两种可编程和读取的状态,即使不供电状态也能保持。对于 M 类同步非易失性存储器 (NVM),PCRAM 似乎兑现了近期的大部分承诺。 电阻式 RAM (RRAM):大多数 RRAM 通常被描述成一个电路,这和电容器、感应器或电阻器不一样,RRAM 提供独一无二的电压和电流关系(不像其他存储电荷或电磁波的知名设备),或者提供电流的线性抗阻。在过去数十年中,使用带有称之为忆阻器属性的材料进行测试,由于它们的非线性属性以及缺乏应用程序,故工程师通常尽量避免使用它们。IEEE 会员 Leon Chua 在 “Memristor: The Missing Circuit Element” 一文中对其进行了介绍。忆阻器行为可概括为:一个方向上的电流导致抗阻性增加,而另一个方向上的电阻降低。同样地,可以存储一个非易失性状态,并可进行编程以及状态读取。 自旋转移矩 RAM(Spin transfer torque RAM,STT-RAM):通过磁层的电流可产生一个自旋极化电流,当指向一个磁层时,该电流可通过角动量改变其方向。该行为可用于激发震动以及翻转纳米级磁设备的的方向。主要缺点是翻转方向需要较高的电流。

从系统角度来看,随着这些设备的发展,在何处使用这些设备以及每个设备如何更好地填补存取间隙取决于设备的以下方面:

成本 可扩展性(设备集成
大小必须小于晶体管才能战胜缓存;小于 20 纳米) 程序和读取延迟 设备可靠性 或许最重要的是持久性(在变得不可靠之前的编程和擦除频率)。

基于这些设备性能考虑因素,IBM 将 SCM 归为两大类:

S 类:通过 I/O 控制器异步存取。线程或多编程被用于隐藏设备的 I/O 延迟。 M 类:通过一个内存控制器同步存取。可以认为这是一个 RAM 存取等待状态,该状态下 CPU 核心停止运行。

而且,NAND SSD 被认为是快速存储、通过面向块的存储控制器进行存取(更高的 I/O 率,但类似旋转磁盘驱动带宽)。

对于数据处理来说,这看起来似乎像是取消了异步 I/O(当然,除了归档存取或者集群扩展之外),但对于以数据为中心的处理来说,这可能是万能良药。从某种意义上说的确如此,但是系统设计师和软件开发人员必须改变这一习惯。在系统的每个节点上 I/O 延迟隐藏需求很大程度上都会消失,但无法完全消失。InfiniBand 中的集群构建将使用 Message Passing Interface 或 MapReduce 模式来处理节点到节点的数据传输延迟,您可以享受这个设想 SCM 节点的类似性能,但在启动的时候或者在节点数据超过节点工作 RAM 大小的时候除外。

因此,对于扩展而言,集群互连和集群中节点之间的 I/O 延迟隐藏仍然是必需的。

通过协处理器使处理更倾向于数据

快速存取大数据似乎很完美,而且看起来很有前景,但是有些应用程序总会从另一个备用方案(使处理更接近数据接口)获益。有很多这样的示例,比如图形(图形处理单元,GPU)、网络处理器、协议卸载引擎(比如 TCP/IP Offload Engine、芯片上的 RAID、加密协处理器,以及最近出现的计算机视觉协同处理器理念。我的研究涉及计算机视觉和图形处理器,无论是在具有一定规模的集群还是在嵌入式系统中,都存在计算机视觉和图形处理器。我将目前从事的工作称为计算机视觉处理单元,随着 Khronos 对 OpenVX 2012 通告的发布,与几个协处理器相比,这将获得更多的大众的追求。

在嵌入式世界中,这样一种方法可能被描述成一个智能传感器或智能相机,原始数据的预处理方法是由传感器接口、一个嵌入式逻辑设备或者微处理器,甚至是芯片上的多核系统 (SoC) 提供的。

在可扩展世界,这通常涉及到协处理器总线或渠道适配器(比如 PCI Express、PCIe 和 Ethernet 或 InfiniBand)的使用;它在数据源(网络端)和节点 I/O 控制器(主机端)之间提供数据处理。

无论是处理应该已经完成还是处理应该更为高效,当在 I/O 路径或 CPU 核心上进行处理时,它们都是热门讨论主题,但是根据现有理论(GPU 和网络处理器),这很明显非常有用,与处理器相比,采用基于协处理器技术的用户更为普遍。因此,我们将快速浏览其中的几个方法:

适用于单个程序多个数据的向量处理 目前由 GPU、多用途 GPU (GP-GPU) 和应用程序处理器单元 (APU) 提供。理念是数据可以按照自己的方式转换到某个输出设备(比如,显示器)中,或者发送到一个 GP-GPU/APU,并在主机到设备的往返过程中进行转换。“通用” 意味着更为复杂的功能,比如,与单精度运算相比,双精度运算仅适用于特定的图形处理。 多个核心 传统多核心处理器卡可供各个供应商使用。这里涉及的原理是:通过使用简单但数量
众多的 I/O 总线核心降低成本和功率消耗,对卡片使用双程卸载进行处理拥有更强大的功能,但是更耗电,而且需要昂贵的、全面的多核主机。通常,多核协处理器可能比主机需要更多的核心,通常会包括千兆或者 10G Ethernet,或者其他类型的网络接口。 I/O 总线现场可编程门阵列 (FPGA) 在开发早期阶段,FPGA 卡通常用于原型化一个新处理器,也可用作一个小容量协处理器解决方案。 嵌入式 SoC 一个多核解决方案,在 I/O 设备中,可使用该解决方案来创建诸如立体测距或飞行时间相机之类的智能设备。 界面 FPGA/可配置的编程逻辑设备 数字逻辑状态机可提供缓冲和持续的 I/O 数据转换,比如数字视频编码。

时间: 2024-08-02 22:11:50

如何利用云扩展协同处理、非易失性存储器互连和存储的相关文章

云扩展,第 2 部分: 查看高性能云系统设计进展情况

学习如何利用协同处理.非易失性存储器.互连和存储 要意识到缩小存取差距或使用协处理器将进程推进到 I/O 路径的潜在优势,突破设备技术要求系统设计师重新思考如何进行应用程序软件设计.探讨和考虑最新内存.计算设备.互联设备和子系统如何影响您的可扩展的.以数据为中心的.高性能云计算系统设备.设备技术中的突破被用于 "以计算为中心" 和更为平衡的 "以数据为中心" 的计算基础架构之间的转换. 作者调查了存储级内存,演示了如何填充 RAM 和旋转磁盘存储之间长期存在的性能差

企业利用“云”开创容灾备份全新模式

[导读]业务高速发展,企业数据急剧膨胀.与此同时,数据安全性正遭受着前所未有的威胁,自然灾害.系统故障.企业员工误操作和病毒感染都有可能导致数据的破坏和丢失. 业务高速发展,企业数据急剧膨胀.与此同时,数据安全性正遭受着前所未有的威胁,自然灾害.系统故障.企业员工误操作和病毒感染都有可能导致数据的破坏和丢失.而企业已经把关键数据视为正常运营的基础,一旦遭遇数据灾难,运营必然陷入瘫痪,带来的损失难以估量.因此,企业不仅需要足够的容量存储数据,还需要实现数据的安全备份和远程容灾,以满足日益增长的安全

【CSDN在线培训Q/A】如何利用云平台构建容错的APP

8月13日,亚马逊AWS中国云解决方案架构师王毅在主题为"如何利用云平台构建容错的APP"的在线培训中,为我们讲述了如何在系统架构的时候充分利用云平台的各种特点,从而了解如何在AWS这样的云平台进行架构设计的技巧及相关资讯. 为了帮助大家更好的复习本次培训的相关内容,了解如何在AWS这样的云平台进行架构设计的技巧及相关资讯.CSDN整理了本次培训最后的QA,如下: Q1. 请问在分区机制中,如果应用请求距离A区在物理上距离最近.响应时间上也最快,在负载不重的情况下,那Elastic L

Windows Azure如何帮助企业利用云的速度、规模和经济效益

编辑人员注释:本文章由 Windows Azure 产品市场营销部门的 Scott Woodgate 和 Karri Alexion-Tiernan 撰写 在过去几个月,您可能听到我们谈论"融合的力量",我们分享了内部部署 Windows Server 和云中的 Windows Azure 如何帮助企业利用云的速度.规模和经济效益.现在,我们要通过为开发人员和 IT 专业人员进行大量的新投资,扩展这一力量. 对于我们的开发人员,我们知道,开发和测试方案往往是组织进入到云的首要阶段.所以

瑞云渲染梁幸尧: 利用云服务实现超级电脑技术

10月30日-31日,2014腾讯全球合作伙伴大会在海南博鳌顺利举行.随着互联网科技的高速发展,互联网行业出现了爆发式的增长,大量资金与人才纷纷投入互联网创业大潮之中.10月30日腾讯云"大云端·大生态"峰会设立"如何打造互联网精品"的圆桌讨论,众多来自互联网新兴领域的大佬们展开了探讨. 腾讯云计算公司副总裁陈晓建.Rayvision瑞云渲染董事长梁幸尧.南京泥巴怪公司首席技术官秦川.上海良栀之志网络科技有限公司首席执行官冯良会.未来电视首席执行官张宇霞.Visua

如何利用云主机解决网站崩溃问题?

根据http://www.aliyun.com/zixun/aggregation/33826.html">CNNIC报告,截止今年6月底我国的网民规模达5.91亿,互联网普及率为44.1%.从这两个数据我们也可以看出,互联网已经成为了不可撼动的庞然大物,而互联网的普及必定带动网站建设事业的发展.但是伴随着发展网站建设也遇到越来越多问题,网站的不稳定,系统容易崩溃牵绊着企业前进的步伐. 导致网站崩溃的因素很多,大体可以分为内部原因个外力原因.内部问题都是一些常规的错误引发而成的,如磁盘已满

云扩展,第 3 部分: 探索云中的视频分析

使用各种方法.工具和系统设计执行视频和图像分析.监视和安全保护 探索和分析通过云扩展来执行视频和图像分析的方法.工具和系统设计.本系列之前的文章已经介绍过,与传统的以计算为中心.可伸缩.高性能计算相比,视频分析需要一种更加平衡的"以数据为中心的计算架构".作者介绍了如何将 OpenCV 和类似工具用于数字视频分析和方法,以便使用集群和分布式系统设计来扩展此类分析. 前几期文章中讨论了专为视频分析和新的 OpenVX 硬件加速而设计的协处理器,可将它应用到本文中提供的计算机视觉 (CV)

利用云效度量功能进行质量运营和效率驱动提升

作者简介:张冠楠,阿里巴巴技术专家,负责过阿里巴巴集团运维系统.研发中台系统以及阿里云持续发布系统的质量保障工作,致力于如何保障研发团队产品质量,同时提升研发团队的研发效率.在质量保障体系建设.持续集成领域.敏捷实践领域和研发效能领域方面均有研究. [前言] 先表示感谢和敬意:本文中所有数据都来自云效度量数据功能页面截图(部分数据功能云效暂未开放给所有用户,所以截图会有些许区别).我会在本文就各种具有关键表征的数据进行介绍,但是详细数据包括您的研发团队的数据,还是需要您亲自访问云效公有云度量功能

看我如何利用文件扩展名绕过AppLocker?

本文讲的是看我如何利用文件扩展名绕过AppLocker?,绕过AppLocker的限制通常需要使用Microsoft信任的二进制文件来执行代码或弱路径规则.然而,在系统中,系统已经配置了默认规则,并且允许使用命令提示符和PowerShell来通过使用具有不同文件扩展名的有效载荷来绕过AppLocker. 可以使用Metasploit 的Web delivery模块来托管要使用到的powershell有效载荷,并从目标中检索传入的连接. exploit/multi/script/web_deliv