大流量高并发互联网应用实践在线峰会官网:
峰会统一报名链接:
议题名称:《如何打造应对超大流量的负载均衡》
议题简介:作为一个公网流量的入口,阿里云负载均衡应对超大规模流量的信心是什么?又如何去保持平稳顺滑的运行?为了应对各种大规模的活动,阿里云负载均衡又走了哪些性能调优之路?此次,阿里云高级技术专家将从集群部署、负载均衡高可用框架,流量监控,指标等多个方面为大家揭开。
关于分享者
朱小平(花名:近墨),阿里云网络技术团队高级技术专家,阿里云负载均衡产品研发负责人,从事多年传统硬件及软件定义网络相关研发工作,2015年负载均衡支持双十一总负责人。
更多峰会议题,请参见大会官网:
采访正文
朱小平之前从事多年传统硬件网络研发工作,关于网络负载均衡相对于传统硬件负载均衡间的优势,他为大家简单了做下介绍。他说,网络负载均衡相比于传统硬件负载均衡,第一个优势是可扩展性强。网络负载均衡一般都是集群部署,可以是4台,8台或者16台一个集群。随着集群规模的增加,性能和容量会线性增加。而传统硬件负载均衡一般都是主备集群,可扩展能力比较弱。
网络负载均衡第二个优势是性能强大。网络负载均衡,一般都需要强大的性能去应对大流量的冲击,所以会在硬件选项、软件优化上,不断提高性能,而传统硬件负载均衡的性能需求就没有那么迫切。
同时,朱小平也是阿里云负载均衡产品研发负责人,在打造阿里云负载均衡的过程中,都遇到过到哪些技术挑战,如何解决的?这一问题令人很好奇,我们也进行了采访。朱小平介绍说,主要遇到的挑战就是2个方面:
- 第一个挑战是稳定性。众所周知,稳定性是云的最基本要求,这承载着用户的信任和托付。为提高产品的稳定性,我们建立了产品质量保障体系,主要包括这几个方面:设计评审;代码评审;单元测试;集成测试;稳定性和异常测试;代码覆盖率;灰度上线以及容灾演练。这个质量保障体系会形成一个产品定义、研发、运维和应急响应的闭环,不断提升产品的质量和稳定性。
- 第二个挑战是可用性。任何产品都有可能出故障,所以我们要在产品的架构设计上,增加系统的冗余度,保证任何一条链路出问题,都不会影响整体的可用性。我们还增加了用户服务的可用性监控,用户链路质量的监控,及时发现和定位故障,避免用户服务不可用。
大家不太了解的一个情况是,2015年淘宝购物节创造了900多亿交易量,这一天大量的用户流量跑在了阿里云负载均衡上。谈到到底是如何扛住如此大流量的时候,朱小平为我们介绍说,这里面的关键技术就是上面提到的可扩展的集群架构,以及单机的高性能。集群的容量,都是按双11的峰值的两倍去准备的,性能有保障。
双11做为阿里巴巴最重要的促销活动,吸引了全中国,乃至全世界消费者的关注和参与。这么重要的活动,如何保证各系统稳定,可靠的运行就是技术人员需要考虑的。从最开始的峰值参数预测、系统搭建、压力测试和演练等等,多个团队和部门协同,唯一的目标就是为全球消费者呈现一个稳定,可靠的舞台,让大家尽情狂欢。
在本次技术峰会上,朱小平将分享《如何打造应对超大流量的负载均衡》
,大家可以了解下阿里云负载均衡团队在slb 高性能、大容量、高可用性上做的一些事情,以及是如何支持用户服务的高可用。