RDMA高速低延时网络:流动缓存背后的功臣

戴尔Fuild Cache for SAN,在服务器闪存缓存与SAN阵列的集成方面可谓独树一帜。相信一些读者对该技术已经不陌生,除了那500万IOPS的Demo之外,网上也能找到相关资料和分析的文章,如:《性能与ILM的平衡:服务器闪存缓存的思考》。今天我们想回顾一下Fuild Cache for SAN的独特技术优势,以及在流动缓存背后的功臣——RDMA高速低延时网络。

如果说PCIe/ NVMe打通了主机内部CPU与闪存之间通道的话,那么RDMA over InfiniBand或者RoCE则能够有效改善跨节点的闪存访问性能。

Fuild Cache for SAN的独特优势

1 SAN整合尽管有多家厂商都宣称他们的服务器闪存缓存软件,可以配合后端SAN存储使用,但许多也标明了只是单机读缓存。除了戴尔Fuild Cache for SAN之外,具备分布式缓存一致性和RAC支持的寥寥无几。

这里要强调一下,早期的Server Flash Cache软件通常不支持像Oracle RAC这样的双活(Active/Active)集群访问,简单说就是当一台服务器向后端共享存储中写入数据时会锁定整个LUN。而Oracle RAC需要的是传统SCSI-3规范的细粒度锁机制,一个LUN上的不同LBA允许同时接受来自多个服务器的写操作。

分布式缓存一致性解决的就是协同,或者说数据一致性。如果由一台服务器改写了后端LUN内的数据,在另一台服务器上Flash Cache内也有对应的数据块,需要做过期处理,也就是说要维护一个同步的缓存元数据索引。

Server Cache Pool——戴尔将Fuild Cache for SAN称为缓存池,是因为一台服务器闪存缓存中的数据可以供集群中别的服务器加速存储访问,而后者并不是必须要作为这个闪存缓存池的贡献者。

2 Server Cache Pool戴尔将Fuild Cache for SAN称为缓存池,是因为一台服务器闪存缓存中的数据可以供集群中别的服务器加速存储访问,而后者并不是必须要作为这个闪存缓存池的贡献者。

3 异构服务器访问既然Fuild Cache for SAN网络中不是每个服务器节点都需要配置闪存缓存(最少2个贡献节点+1个仲裁节点),那么也就允许第三方服务器加入集群。

4 Write-back(写回)缓存支持尽管一家戴尔友商曾表示将支持write back写缓存,但直到去年我们也没有看到这一功能的发布。

闪存一旦用于读&写缓存,和自动分层存储已经有相似之处。只是数据是否最终要持久化到后端的问题,因为这时闪存中的待写入数据必须保证可靠性和高可用性。

这就涉及到本文的重点——RDMA网络。为了缓存池中的全局访问,还有把每台服务器的闪存写缓存镜像到其它节点以实现冗余,最好能有一个低延迟的专用高速网络。


5 低延时专用互连网络戴尔Fuild Cache for SAN需要配置专用的40Gb或者10Gb RoCE(RDMA over Coverge Ethernet)缓存通信网络,RoCE在相同速率下的性能/延时表现可以媲美InfiniBand。我们看到部分多控制器的高端存储阵列,其节点间就是用IB网络互连,而戴尔Fuild Cache for SAN的闪存缓存池更加靠近服务器,取得更好的性能也在情理当中。

延时大跳水:绕开TCP/IP协议栈开销


如上图,我们看到40GbE和10GbE交换网络的物理延迟(当然不包括TCP/IP)分别只有0.6和0.8微秒,RoCE(RDMA over Coverge Ethernet)的延迟也不到1微秒。这里我理解的应该是主机到交换机。

直行何必绕弯——看RDMA如何工作


来自去年闪存峰会资料的这张图,简明的解释了RDMA over IB和RoCE的好处:从User层(用户态)绕过Kernel层(内核态),直接走InfiniBand HCA或者RoCE网卡从网络发送数据;即从应用的buffer缓冲,绕过了OS的接收和发送buffer,甚至网卡上都可以不再做buffer。当然,我们前面提到的另外一点——绕开TCP/IP也是改善性能的重要因素。

从RNA内存虚拟化到Fuild Cache for SAN


上图来自Mellanox 2011年的资料,Mellanox是最大的InfiniBand网络设备制造商,也是RoCE的主要发起者。戴尔与Mellanox在高性能计算和存储方面有着紧密的合作。

RNA这家公司已于同年被戴尔收购,上面的对比数字是他们之前的MVX内存虚拟化产品在RoCE和TCP/IP网络下的延时对比。注意这里是应用级Benchmark和Round Trip延时,当时使用的ConnectX-2是10Gb万兆网卡。从测试结果来看,RoCE延时只有TCP/IP网络的1/3多一点。

值得一提的是,Fuild Cache for SAN正是RNA的技术融入戴尔之后推出的产品,将RoCE高速网络与PowerEdge服务器上ExpressFlash NVMe PCIe SSD的优势结合起来,相得益彰。

  

作者:唐僧

来源:51CTO

时间: 2024-08-03 11:46:16

RDMA高速低延时网络:流动缓存背后的功臣的相关文章

谁是网络广告增长背后的“功臣”

经济危机在国内正进一步扩大蔓延,房地产.汽车等重点经济产业身受重创,整个大环境黯然无色.可就在这个时候,第三季度网络收入却仍以同比超过19.1%是速度增长,究竟谁是背后推动着网络广告增长的主力和功臣? 中国已经拥有超过2.53亿的网民,6.16亿的手机用户,排名均在世界首位,其中手机网民也将冲破一亿.国内互联网最大的特点就是以年轻用户居多,他们的消费能力和消费潜力比较高,对新产品或服务的认可周期较短,这对于有自己网络营销平台的消费品企业,效果会更为明显,能起到事半功倍的作用.对于消费者来说,网络

Databus:LinkedIn开源低延时变化数据捕获的系统

2月26日,LinkedIn开源了其低延时变化数据捕获系统Databus,该系统可以在MySQL以及Oracle数据源上捕获数据,不过当下LinkedIn只开源了Oracle上的连接器.Databus作为LinkedIn生态系统中的一致性保障组件,是具有十分高保障的一项产品,就算在低延时的情况下仍然具有高有效性;而其最大的特点莫过于无限制lookback能力及丰富的subscription功能. 以下为LinkedIn上Databus简述译文: 何为Databus LinkedIn拥有一个针对数

印度电信巨头牵手阿里云打造高速跨地域网络连接

4月26日云栖大会·南京峰会消息,印度电信巨头信实集团旗下Global Cloud Xchange(GCX)与阿里云达成合作,双方将携手在亚洲市场拓展云计算业务,为用户提供更加高速的跨地域网络连接. 4月26日云栖大会·南京峰会消息,印度电信巨头信实集团旗下Global Cloud Xchange(GCX)与阿里云达成合作,双方将携手在亚洲市场拓展云计算业务,为用户提供更加高速的跨地域网络连接. 据了解,GCX拥有全球最大的私有海底光缆系统,跨越6.7万公里的海缆系统与其母公司信实通信的20万公

如何搭建直播平台?低延时连麦+人工智能让互动升级

2016年是直播平台爆发增长的一年,直播领域不断有新应用进入,其他垂直领域也纷纷加入直播功能.为了快速切入行业,掌握市场先机,绝大部分公司都选择了用视频云厂商的解决方案来促成业务能力的快速实现,如同快手.虎牙.熊猫TV.陌陌.全民TV等热门直播平台均采用了阿里云的视频直播解决方案. 阿里云视频直播服务(ApsaraVideo Live),提供端到端的一站式视频直播解决方案.通过集成阿里云直播SDK,用户可以轻松实现移动端.PC端的直播流推送.直播服务器接收到直播流,对流进行处理(转封装.转码等)

H.265低延时编码 IP技术

RealityCodec基于FPGA的低延时H.265编码 IP技术,用Xilinx FPGAs作为开发目标.这种低功耗,低成本视频编码方案适用于监控,医疗,广电,企业,视频会议,云计算和政府部门使用. 特性  分辨率帧率最大可达2160P30(4K)  2个同时独立编码码流  延时从小于一帧到4秒可编程  应用集成的主机API接口  4:2:0 8位和10位  I帧和P帧(不久将来会有B帧)  接口整合 优势  和H.264相比较,相同视频质量,码率减少50%  延时:小于一

卡巴斯基剖析网络彩票的背后赤裸裸的网络诈骗行为

相信很多人都收到过标题为"中奖通知"的电子邮件,甚至收件箱都被这类垃圾邮件挤满.其实,这类垃圾邮件的内容和形式都大同小异首先通知收件人获得了一笔巨额大奖,为了能顺利获得奖金,收件人必须先支付一定的手续款.看上去的确很诱人,事实上,这就是赤裸裸的网络诈骗行为. 卡巴斯基实验室垃圾邮件分析员Maria Rubinstein在她的分析文章"恭喜您获奖了网络彩票的背后玄机"一文中,详细指出网络诈骗分子常用的伎俩,并给出一些有用的建议,帮助人们分辨虚假彩票信息和真正的通知.

网络淫秽表演背后三大利益链条

本报记者 甘丽华 警方分析,色情网站犹如一个场,在这里既有"骗子",也有"小偷",还有只管卖刀不管刀是不是用来杀人的所谓"第三方".于是,一个案件牵扯出若干个网络诈骗.网络盗窃.网络色情.输入计算机病毒等集群性案件.在其背后,至少存在三大利益链条. 网络"广告联盟"利益链 随着网络广告的快速发展,各种广告联盟比比皆是.根据资料,广告联盟是将广告主的广告分配展示到各大会员网站上去的一个中介平台.其操作模式是广告主把钱交给广告联盟

Android 中Volley二次封装并实现网络请求缓存

Android 中Volley二次封装并实现网络请求缓存 Android目前很多同学使用Volley请求网络数据,但是Volley没有对请求过得数据进行缓存,因此需要我们自己手动缓存. 一下就是我的一种思路,仅供参考 具体使用方法为: HashMap<String,String> params = new HashMap<>(); params.put("id", "1"); params.put("user", &quo

CNNIC刘冰:交易应用率低导致网络价值被低估

CNNIC互联网发展研究部主任刘冰(右).高级分析师陈建功(左) 7月16日下午消息,CNNIC互联网发展研究部主任刘冰.高级分析师陈建功今日接受新浪科技专访,点评第24次互联网调查报告.他们认为网络商务交易应用率低导致互联网价值被低估,而造成应用低的原因是网络交易信任程度依然不高. 中国互联网络信息中心CNNIC今日下午在北京公布第24次互联网调查报告.报告显示截至2009年6月30日,中国网民规模达到3.38亿,普及率达到25.5%:网民规模较2008年底年增长4000万人,手机网民规模为1