阿里管控系统靠什么扛住全球最大规模的流量洪峰?

双 11 不仅是一场全球消费者的狂欢,也是对中国互联网技术体系的实力检验。一下子几千万人涌进来买买买,这种真实的商业场景全世界一年也只有一次。全球最大的支付平台之一, Visa,在实验室取得的测试数据是 5.6w 笔每秒;而双十一这天,支付宝在实战中达到了每秒钟 8.6 万笔,交易订单的创建量更是达到了每秒钟 14 万笔,刷新了网络交易峰值的世界纪录。 从 11 月 10 号深夜日常的交易数量陡然飙升到每秒钟提交 14 万笔订单,这中间经历了一个怎么样的过程?突然爆发的流量洪峰对业务链路的冲击又有多大?除此之外,线上复杂性也是惊人的,仅仅一个购买动作,就包含从关键字搜索,挑选商品,再到购物车结算,优惠抵扣,生成订单,支付宝付款等一系列的流程,涉及上百个应用,链路上的任何一个”零件”出了问题,都有可能导致交易的失败。

其实我们的高可用架构团队是由多个系统组成的,例如强弱依赖,弹性等,他们一定是互相作战的。这个系列会主要介绍和双十一比较密切的阿里管控系统。 这个体系主要是由下面几个系统组成的: 限流,降级以及流量调度,预案开关。

这篇文章里面,我们先来看一下限流。

限流的必要性

双十一从一开始,就会有这样的自带属性, 商家会提前1个星期甚至1个月,把自己参加活动的商品放出来;剁手党呢,也会提早把这些商品挑选出来放在购物车里面,但是他们一定是屏住不买,一直到0点0分才会开买。为什么?提前一秒买没有折扣,推迟一秒买可能商品就抢光了。

这个属性,换算成工程师的语言来说,就是前一秒的qps(request per second,每秒到达的请求量)非常低,但是下一秒请求量就会飙高。我们再用数据来看一下双十一当天的流量: 创建订单的峰值时14w笔,天猫天猫移动端销售金额突破1亿仅用了75秒,销售金额破百亿仅用了38分钟…这些数据,只是当天流量的冰山一角。

如果这些流量没有抗住,会出现什么呢?想象一下这样的场景,流量大,承载这些流量的机器负载会增高,如果这个应用的一两台机器没有率先扛不住了,那么本来应该这些机器承载的流量就间接由其他的机器承担了。本来这些机器就处于一种临界状态,这样雪上加霜,那么这些机器也挂了。就这样1变2,2变4,4变8,整个集群就如同雪崩一样,都挂了。这样谁也买不了东西了。

所以我们必须要有限流.

如何限流

每一年双十一0点0分的流量,对我们来说是宝贵的数据。有了这些数据,我们根据大数据对明年的双十一的峰值进行评估,容量规划。这是第一步。

第二步,就是梳理限流的用户体验了。一般来说,是不同的场景有不同的限流体验。比如说,双十一零点,用户可能看到这个页面,提示用户等待并且重试,从而达到限流的效果

限流场景

1. 用户洪峰

刚刚我们描述的情形,其实就属于用户洪峰。对于这种洪峰,我们需要考虑的因素是:

a) 允许访问的速率
b) 系统承受的最大洪峰
c) 洪峰爆发的间隔时间

对于这种流量,我们的处理是: 令牌桶限流

a) 允许访问的速率:令牌桶发放的速度 r
b) 系统承受的最大洪峰:当令牌桶满的时候,洪峰到达,这个时候应用会承受最大的qps冲击 桶的容量+该秒令牌桶发放的速度r
c) 洪峰爆发的间隔时间,也就是说,什么时候令牌桶会再次满, m<r,否则洪峰不会到来

2. 回调洪峰

除了0点0分的这种流量洪峰,还有系统之间的回调引起的洪峰。想象一下这样的场景,物流系统为了处理发货信息,会隔一段时间调用交易系统来获取交易信息。为了提高效率,它每次批量查询交易系统的数据。这样,对交易系统也带来了流量的冲击。如果对这种回调不加以限制,那么可能交易系统忙于处理这种回调洪峰,对用户洪峰会疏于处理。

对于这种洪峰,有三种特色:
a) 有间隔频率
b) 每次调用量大
c) 允许有延迟

对于这种洪峰,我们的处理方式是使用漏桶算法

这种算法也类似一个水桶,随机的往水桶里面放水,但是以固定的速度往下漏水。和上一种的算法不一样,主要是塑形。达到的效果是放给应用的流量,永远是固定的。

那么回答这个场景的问题,一个请求最迟延迟多久得到处理: τ/(

时间: 2024-09-28 21:41:28

阿里管控系统靠什么扛住全球最大规模的流量洪峰?的相关文章

印度电信巨头牵手阿里云 拥有全球最大规模私有海底光缆

       4月26日云栖大会·南京峰会消息,印度电信巨头信实集团旗下Global Cloud Xchange(GCX)与阿里云达成合作.GCX拥有全球最大规模海底光缆系统,规模达6.7万公里,双方将携手在亚洲市场拓展云计算业务,为用户提供更加高速的跨地域网络连接.        据了解,GCX拥有全球最大的私有海底光缆系统,跨越6.7万公里的海缆系统与其母公司信实通信的20万公里国内光纤骨干线路无缝整合,提供了一个强大的全球服务网络.        "云计算市场发展迅速,科技创新日新月异,我

如何扛住1.8亿/秒的双11数据洪峰?阿里流计算技术全揭秘

双11刚刚拉下帷幕,激动的心还停留在那一刻: 当秒针刚跨过11号零点的一瞬间,来自线上线下的千万剁手党在第一时间涌入了这场年度大趴--从进入会场到点击详情页,再到下单付款一气呵成. 前台在大家狂欢的同时,后台数据流量也正以突破历史新高的洪峰形式急剧涌入: 支付成功峰值达 25.6 万笔/秒 实时数据处理峰值 4.72亿条/秒 而作为实时数据处理任务中最为重要的集团数据公共层(保障着业务的实时数据.媒体大屏等核心任务),在当天的总数据处理峰值更是创历史新高达1.8亿/秒! 想象下,1秒钟时间内千万

启迪国信助力四川戒毒局构建“警务通终端管控系统”

随着"互联网+戒毒"战略的实施,戒毒局移动警务通系统建设成为大势所趋.四川省戒毒管理局在全国司法系统中有较大影响力,其下属的资阳强制隔离戒毒所在2015年被司法部授予集体一等功,信息化水平一直走在全国司法系统前列. 四川省戒毒管理局所辖的戒毒所大致可以分为两个区域,即隔离区和办公区.隔离区为被强制隔离人员工作.生活和活动的区域,办公区为工作人员进行办公与管理的区域.警务通具备模式切换功能,进入隔离区时,切换成警务通工作模式,出隔离区时切换成普通个人模式.管控系统禁止任何隔离区内数据通过

NSA内部搜索系统曝光:可查询全球通讯数据

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 NSA内部搜索系统曝光:可查询全球通讯数据 新浪科技讯 北京时间8月26日早间消息,据新闻网站The Intercept报道,美国国家安全局(以下简称"NSA")2007年启动了一个名为ICREACH的搜索系统,使得美国20多个机构的成员可以快速过滤美国人和外国人的通讯元数据. ICREACH搜索系统的界面 该系统的目的是

阿里云系统跟谷歌安卓系统大战持续难见胜负

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;             已停止 [硅谷网9月17日讯]大家好,欢迎收听"小小报IT".今天我们来说说阿里跟谷歌(微博)在手机操作系统上的这场大战,在这场大战中双方各执一词:谷歌指责阿里云盗用了安卓机制,却不兼容于安卓平台:而阿里则一口咬定自己的阿里云OS 是自主研发的.不过目前阿里云内部员工有人承认:阿里云OS其实还是Android,只是把代码中

卡普:卖掉Tumblr因没扛住梅耶尔攻心战

Tumblr创始人卡普( 腾讯科技配图)腾讯科技讯(晨曦)北京时间5月31日消息,据国外媒体报道,最近,雅虎斥资十亿美元,拿下博客兼社交网站Tumblr.Tumblr创始人卡普日前接受媒体采访披露,今年本来没想着转让Tumblr, 但是最终还是经受不了雅虎CEO梅耶尔苦口婆心的"思想工作",最终同意加盟雅虎.在周四播出的一个访谈节目中,卡普表示:"我没有计划今年卖掉Tumblr."卡普说,按照原来的计划,Tumblr计划和雅虎展开合作,双方的合作项目从去年底开始接触

阿里与创维发布智能电视 内置阿里云系统

摘要: 阿里与创维发布智能电视 内置阿里云系统 9月8日消息9月8日,阿里巴巴集团向媒体发出了邀请函,阿里巴巴在邀请函中称,阿里巴巴将与创维集团于9月10日上午在北京对外发布旗下新款 阿里与创维发布智能电视 内置阿里云系统 9月8日消息9月8日,阿里巴巴集团向媒体发出了邀请函,阿里巴巴在邀请函中称,阿里巴巴将与创维集团于9月10日上午在北京对外发布旗下新款酷开电视. 据知情人士透露,阿里巴巴在此次与创维的合作中,阿里巴巴将会将旗下阿里云系统预置进入新款酷开电视中,知情人士透露,若此次合作顺利,阿

阿里云数据库专家玄惭:云数据库超大流量峰值保障最佳实践

大流量高并发互联网应用实践在线峰会官网:https://yq.aliyun.com/activity/112 峰会统一报名链接:http://yq.aliyun.com/webinar/join/49 议题名称:<云数据库超大流量峰值保障最佳实践> 议题简介:本次演讲收集整理了自RDS成立至今,在历次大流量峰值中如何保障活动中云数据库备战的最佳实践,包括之前的改造,压测和扩容:期间的监控,预案执行和应急处理:之后的收容和总结.力求全链路地帮助客户安全稳定地渡过超大流量峰值,让在你备战过程中少走

全球移动数据流量哪家强

腾讯数码讯(编译:张晓微)虽然Android系统早已在全球每月智能手机出货量上超越了iOS,但是在网络数据流量方面,却一直都是iOS设备稳居第一.要知道网络流量贡献值也是衡量设备受欢迎与否的一个重要因素.不过根据最新的状况来看,Android与iOS之间这种胶着的竞争可能将会在未来数月产生重大变化. Android与iOS流量已接近 根据Net Applications最新统计公布的今年六月份全球网络流量报告显示iOS网络流量最近几个月逐渐下滑,而Android平台则呈现上升趋势,并将会在未来一