阿里巴巴的双十一全球购物节近年来交易额逐年扩大,2015年的双十一交易额达到了一个惊人的数字。4万多商家和3万多个品牌的参与,总计143亿美元的GMV(同比去年增长60%),而通过移动端支付宝进行支付的占总GMV的68.7%。阿里巴巴的双十一已经成为世界上单天交易额的最顶峰,很难相信,在2009年第一次双十一的时候只有27个参与的商家。
在双十一全球购物节期间,订单创建的峰值一度达到每秒8万个订单,这给云计算基础设施带来了庞大的流量。为了解决与传统云网络相关的限制,提高与计算网络的可伸缩性、可靠性、降低成本,阿里选择了数据平面和控制平面分离的SDN技术来解耦底层网络和Overlay网络。
我们采用VXLAN和OpenFlow技术的Overlay方式,构建了稳定的、self-learning网络拓扑和self-routing的传统网络转发路径,经过我们的实验,我们发现它完全可以支持我们的混合云环境。
其实在15年5月的SDN大会上庞俊英女士就谈到了阿里在SDN上的探索,她讲到了在数据中心使用OpenFlow+VxLAN的驱动力。第一个是大规模部署的问题,在规模小的时候,二层就解决了,当到了一定的规模就会有人提到大二层的各种技术。当然这需要一步步的探索,现在一出门都是万台或者几万台服务器的规模,任何一种纯大二层的技术都不能好好的工作。还有很现实的一个问题,就是VM的迁移,一定要迁移怎么办,这就需要从传统的二层技术向Overlay变迁。第二个是扩展性的问题,如果采用一个一个小集群,那么池化能力一定会被降低,因此选择是Underlay与Overlay的分离。公有云的规模交付如同流水线方式制造虚拟机,管理成本体现在供应链的能力、交付能力等等。网络的弹性能力也成为了刚性需求,如何做自动交付和变更。第三个是混合云的存在,有的物理服务器不支持虚拟化,如果要和云之间连通,混合元就成为刚性需求。
该解决方案是分离转发和控制的重要步骤,我们的分布式控制器提供了一个简单的灵活的方式来管理和运营网络,显著的提高了稳定性和可用性。我们的云计算网络实现了可编程、可伸缩、可定制的特性,而且它是开放的、硬件不可知的;它对我们避免厂商锁定具有重要意义。我们的在这方面的经验是在整个网络的自动化函数中配置不同的流量,以此保证高可视化,我们可以在一年一度的双十一和日常流量中有效管理不同数量的流量,包括峰值和谷值。
最重要的是,我们将这些转化成了给我们客户的便利。通过我们的解耦网络,我们能够为用户提供高质量的购物体验,2015年的双十一能够获得巨大的成功,我们要感谢SDN。
作者:Zhihua Yang,阿里巴巴网络架构组
原文链接:https://www.opennetworking.org/?p=1952&option=com_wordpress&Itemid=316
本文转自d1net(转载)