通用平台下突破时延短板 XSKY利用DPDK增强Ceph网络效能

业界共识,网络层是分布式存储 "性能木桶的最短板"。在存储领域的概念中,一般有两张网络--用户应用与存储对接的"接入网络"和存储系统内部交换数据的"数据分布网络"。传统存储的"数据分布网络"通常用SAS总线或Infiniband网络实现,牺牲的是水平扩展能力和通用硬件特性,换来较低的时延和相对较少的中央处理器负担。而在主流的分布式存储系统中,为了整个集群的硬件通用一致性,和接入部分一样,通常采用基于TCP/IP的以太网进行数据分布工作。基于Linux内核的通用TCP/IP协议栈在10Ge以上的高带宽条件下,面对大量的数据交换工作,性能和资源利用率两方面都难令人满意。

另一方面,TCP/IP网络协议本身是一个复杂庞大的标准,通用的TCP/IP实现通常是一个"谦逊"的方式进行包收发,使得不管在手机,终端,WAN下都有较好表现,但是在目前数据中心网络越来越快的背景下,特别是存储后端速度飞速提高下,通用TCP/IP栈已经很难满足需求。那么是不是意味着在兼容性和性能两方面一定要进行取舍?

DPDK是Intel、6WIND、Calsoft Labs、Tieto等公司应对这一问题的解决方案[1]。在x86架构下,处理数据包的传统方式是CPU中断方式,即网卡驱动接收到数据包后通过中断通知CPU处理,然后由CPU拷贝数据并交给协议栈。在数据量大时,这种方式会产生大量CPU中断,导致CPU无法运行其他程序。而DPDK则采用轮询方式实现数据包处理过程:DPDK重载了网卡驱动,该驱动在收到数据包后不中断通知CPU,而是将数据包通过零拷贝技术存入内存,这时应用层程序就可以通过DPDK提供的接口,直接从内存读取数据包。这种处理方式节省了CPU中断时间、内存拷贝时间,并向应用层提供了简单易行且高效的数据包处理机制,使得网络应用的开发更加方便[2]。

DPDK技术最初为Intel公司贡献,于2013年开源。DPDK可与Intel、Mellanox等厂商的高速以太网卡协同运行,使得在x86平台上构建和ASIC效能相当的网络模块成为可能,因此,在SDN/NFV领域,DPDK被认为是关键的开源技术之一。

为了推进Ceph存储系统中两个网络的融合化,发挥通用硬件潜力,XSKY[3]自从去年底开始尝试利用DPDK实现数据客户端与OSD之间的网络通信,以及OSD之间数据复制的网络通信,充分利用DPDK的缓存管理、无锁队列与用户态轮询式网卡驱动,在x86通用平台和标准IP交换网络下将数据分布网络的时延降到可与传统存储系统相匹敌的水平。

在 Ceph Jewel版启用的 AsyncMessenger 新网络框架中会支持插件式网络后端,如默认的Kernel TCP/IP,DPDK Userspace TCP/IP[5] 和未来的Infiniband/RDMA网络。AsyncMessenger实现同一个网络会话处理层面向不同的网络设备和后端。新的Userspace TCP/IP[4]栈会最小化TCP的损耗,实现对CPU核的负载分区。结合运行于SPDK NVMe驱动BlueStore,最大化DPDK的资源调配优势,实现端到端的无锁调度和内存零拷贝。

根据最近使用ceph_perf_msgr_server/ceph_perf_msgr_client在原型代码上的测试[5](相当于Linux中的iperf 工具,进行在Ceph网络框架上的消息传输压测),如果采用标准的Linux内核TCP/IP栈,IO发起者和远端OSD组件间的PingPong时延大概在100μs左右;使用DPDK优化的网络协议栈,这个数值降至25~30μs,更加接近IB-RDMA协议栈下5~8 μs的水平。可以预见,这一优化必将使通用硬件上的Ceph分布式存储系统的网络层瓶颈得到又一次突破,以便适应更加普遍的OLTP应用场景。

下图中的时延测试数据包括Message Encode/Decode,Fast Dispatch和整个Messenger会话逻辑,这部分固有延迟时间占据1/3左右。

测试环境在两个物理机之间使用Intel 82599ES芯片的万兆网卡,开启了以下硬件Offload 技术:

1. RX/TX TCP Checksum Offload

2. RX/TX IP Checksum Offload

3. TX TCP Segmentation Offload

4. TX VLAN Tag Insert

5. RX RSS

6. RX VLAN Stripping

7. HW CRC Stripping

8. RX TCP Large Receive Offload

9. Hardware Flow Control

该测试同样适用用于Mellanox MT27710 ConnectX-4 Lx。

在业界利用专用硬件设备如高速网卡,高速SSD和FPGA优化方案层出不穷的背景下,用通用和开放架构解决分布式存储性能问题仍然是一个值得尝试的方向。软件定义存储不仅仅是在API,控制面提供灵活性,更应该在数据面提供开放、通用且统一的存储服务。网络与硬盘性能一直是制约存储软件化的关键因素。而现在,借助于开放的DPDK、SPDK对于硬件能力和丰富特性的抽象,我们希望在兼容性和性能上完成一个平衡,让硬件提供机制,软件实现策略,来真正提供软件定义数据面的能力,给用户提供的是一个开放而又高性能的存储服务。

DPDK网络是构建全用户态软件定义存储的关键一步,XSKY会在下个月的Ceph Off-site会议上贡献DPDK部分代码并开始发起对于主线的合并,并在即将到来的4月7日的产品发布会上将揭示这一技术的全景,敬请期待。

原文发布时间为: 2016年03月31日

本文作者:刘新萍

时间: 2025-01-16 20:12:14

通用平台下突破时延短板 XSKY利用DPDK增强Ceph网络效能的相关文章

银行系电商“搅局”平台流量成最大短板

每日经济新闻(博客,微博)记者 李玉敏 发自福州 在电商鏖战正酣之际,谁也没料到会半路杀出个程咬金,而"搅局者"正是拥有雄厚资金和丰富资源的银行.随着建行"善融商务"平台探索电商金融的深入,其他银行也正在跟进或跃跃欲试. 目前,交行已经推出了 "交博汇",中行广东省分行也尝试性地做了"云购物"平台.此外,工行也可能在明年推出类似平台. 有同时在多个平台开店的商户表示:"和阿里巴巴.京东商城.淘宝等传统电商相比,善融商

酷派自建电商平台补短板 产品区别于线下渠道

5月16日消息,宇龙酷派自建http://www.aliyun.com/zixun/aggregation/7871.html">电子商务平台--酷派商城今天正式上线.至此,酷派在渠道多元化道路上的"短板"得以弥补. 据酷派副总裁苏进介绍,电商渠道是酷派重要的战略布局,在酷派商城上线之后,酷派的电商策略将有所调整,自有商城与第三方电商平台将开始协同运营. 据透露,按照酷派的计划,酷派商城在今年的销售目标将达到10亿元,自建电商与第三方电商平台的出货比例将达到1:1. 苏

银行系电商“搅局”平台:流量与活跃度成短板

在电商鏖战正酣之际,谁也没料到会半路杀出个程咬金,而"搅局者"正是拥有雄厚资金和丰富资源的银行.随着建行"善融商务"平台探索电商金融的深入,其他银行也正在跟进或跃跃欲试. 目前,交行已经推出了 "交博汇",中行广东省分行也尝试性地做了"云购物"平台.此外,工行也可能在明年推出类似平台. 有同时在多个平台开店的商户表示:"和阿里巴巴.京东商城.淘宝等传统电商相比,善融商务和交博汇这样的平台最具吸引力的就是'零成本'或低

android平台下仿短信发送界面

问题描述 打算在android平台下做一个仿短信发送界面,用了三个控件:ListView,EditText,和一个Button.当点击EditText时,软键盘自动弹出,但是把EditText和Button挤了上去,导致Button不能用了,感觉像是ListView挡住了EditText和Button,求助各位大侠如何解决? 解决方案 解决方案二:布局问题

芯片市场化应用仍为短板 业内:以家电为突破口

经过多年的投入和发展,中国芯片产业链已初步建成,在计算机.智能手机.家电和工业控制芯片上均有突破. 但由于中国芯片在市场应用上进展缓慢,难以得到产品线验证和改良等原因,中国芯片产业整体实力不强,缺乏世界级企业.未来中国芯需依靠自身产业链加速应用,利用"制造在我"的优势推进,尽早形成"研发-应用-促进研发-更好应用"的良性循环. 自主研发取得阶段性成果 今年1月,美国总统科技咨询委员会(简称PCAST)发布名为<确保美国半导体的领导地位>报告称,中国半导体

联想为补短板开打服务器之战

当市场重心逐步从PC产业向移动终端转移之时,传统PC企业的出路在于必须做好前后端业务平衡.为了打造完善的后端的云服务,服务器是联想绝对不能丢失的基础. 相较戴尔.惠普,联想打造云环境基础设备的能力较弱,杨元庆必须抓紧时间补齐短板. 一次低调的收购,体现了联想积极的扩张性战略,更让这家PC企业在云计算领域扎得更深. 9月18日,联想宣布收购美国云计算软件开发公司Stoneware.根据联想集团高级副总裁彼得·霍腾休斯(Peter Hortensius)的介绍,Stoneware的云计算技术将会被应

城市危机四伏曝建设规划短板防灾对策存漏洞

火灾多发.交通拥堵.入园难.就医难.环境污染--种种现象不仅让城市居民心烦又无奈,而且已经开始影响城市.社会的发展.这些现象可以用一个词语简单概括--城市病,指的是人口过于向大城市集中而引发的一系列社会问题. 随着城市化进程的加快,城市病已不是大城市的"富贵病",不少二三线城市也已受到城市病的困扰. 本应让生活更美好的城市,如今却成为社会忧心忡忡的对象.如何给城市"祛病消灾"?<法制日报>视点版从今日起推出"关注城市病"系列报道,以期

第三方支付:拿来主义的三块中国短板

马可佳 很多人会忘记银行卡里的最后10块钱. 对于首次接触淘宝的吴先生来说,做淘宝店主的经历就遗留了这样的一个不算完美的"尾巴".最后10元钱没有能及时转入银行卡,而随之而来的紧张工作,让他忘记了自己的支付宝密码. 不经意间,几年过去了,这10元钱就在不知不觉中"沉淀"下来. 这并非一个简单的个案.随着今年"上海每7个就业者里,就有一个是淘宝店主"的全民"皆淘宝"的发展情况,支付宝中"沉淀"的资本究竟有多少

云南智慧城市建设面临四大短板 委员建议先搞顶层规划

"云南智慧城市建设面临四大短板:深度和广度不足.顶层设计不足.推进部门不清.行业人才匮乏."1月18日,云南省政协委员尹子琴和唐兵就我省智慧城市不足方面提出六大改进意见,建议尽快出台云南智慧城市建设顶层规划.建立综合协调领导机制.建立政策扶持机制落实资金保障.将内容创新和业务应用作为基石.建立人才集聚机制.提高智慧系统使用率. 昆明已有智慧城市顶层设计规划 尹子琴和唐兵在提案中表示,智慧城市是信息化.工业化和城镇化的深度融合,对于促进云南省经济的持续健康发展具有重要意义,建设智慧城市有