【干货】零点之战——双十一背后的分布式技术

技术分享视频一

技术分享视频二

零点之战:双十一背后的分布式技术

共享业务的价值

  • 数千应用、亿行Java代码、数十万运行实例
  • 数千Java工程师与专家
  • 24*7 服务亿级用户、每天数千万笔交易

阿里电商分布式技术发展

阿里通过五彩石项目对淘宝和天猫进行了分布式化改造,将业务进行打通与拆分,形成共享服务。

如上图所示,分布式的共享服务支撑着集团大量的业务,保证业务能提供优良的用户体验。


上图复杂的业务场景只是阿里电商业务的冰山一角。

双11的意义与挑战

双11大促的意义

  • 日交易额从09年的5.9亿元狂飙至912亿,增长150倍
  • 交易创建峰值从09年的400笔狂飙至14万笔,增长350倍
  • 业务的狂欢,技术的盛宴
  • 未来的技术储备,今年峰值是5年后的日常
  • 全球最大交易场景零售体,用规模促进技术进步

双11大促的技术挑战

  • 上百个系统用 n倍的服务器支撑m倍的流量
  • 用户体验和资源投入的权衡,用合理的代价解决峰值
  • 稳定性、扩展性、成本、效率、可运维

总结下每年双十一的关键词:

  • 2009年:大促了么?2010年:CDN、带宽
  • 2011年:商品打标、旺旺、降级 2012年:DB、超卖
  • 2013年:无线、压测、单元化 2014年:安全、异地单元
  • 2015年:异地多活、云化弹性架构

双十一带来的巨大流量推动中阿里分布式技术的发展,加速了技术的演进:

开放的技术文化

阿里是国内开源项目最多的公司,官方注册的开源项目303个,2015年新开源的项目65个。
具有众多高含金量的开源项目,点赞超过1000个的项目18个,社区大量参与的项目(fork超过100个)36个。
阿里有众多的Apache、Linux与XEN组织成员。
阿里参与社区开源的工程师超过300人。

有众多明星项目:
Jstorm并入到apache 顶级storm项目:

  • Rocketmq在apache 中孵化
  • fastjson Star 4,439 Fork 1,824
  • tengine Star 4,019 Fork 1,182
  • dubbo Star 3,631 Fork 3,761

阿里中间件性能挑战赛

阿里中间件技术部将双十一的场景开放出来,举办性能挑战赛,让大家来挑战双十一实时计算。
大赛提供了丰厚的奖励与硅谷游学基金,优秀选手将入围阿里校招绿色通道。

更有四位泰斗级导师坐镇,提供专业的指导服务。

部门介绍

阿里中间件技术部,是国内为数不多的极具技术挑战性的团队之一,依托于全球规模最大的阿里巴巴电子商务平台所带来的巨大流量和海量数据,以及对于电子商务平台固有的稳定性要求,使得团队有机会去面对一个又一个技术难题,创造一个又一个技术奇迹。在刚刚过去的“2016双十一网购狂欢节”中,912.17亿元销售奇迹背后的每一笔交易订单都和阿里中间件团队的技术小二们息息相关。

中间件技术部开发了一系列产品,支撑起了阿里整个集团的业务。

赛题与赛制介绍

这次大赛的技术背景主要有两个。一是实时计算,二是NoSql数据库。

  • 实时计算,针对海量数据进行的,除了像非实时计算的需求(如计算结果准确)以外,实时计算最重要的一个需求是能够实时响应计算结果,开源社区比较火热的实时计算流式框架: Storm/Spark Streaming/Flink。
  • NoSql数据库
  • 支持单表PB级别海量数据的非关系型数据库,不受关系型数据库的Schema限制随意拓展,一般具有高可用、高性能、低成本、支持水平拓展等特性。
  • NoSql数据库在阿里内部发展迅速,是OLAP领域数据存储的支柱
  • 开源产品:HBase/MongoDB/Redis等。

业务背景如下图所示:

初赛赛题介绍

赛题:模拟实时统计阿里双十一交易数据
选手利用JStorm从RocketMQ拉取数据,按照要求实时计算出每分钟的统计结果,并将结果实时写入Tair。需要计算值如下:

  • 每分钟淘宝/天猫交易额
  • 每个整分时刻,无线和PC端历史总交易额的比值

比如计算2015/11/11 11:11:00整分时刻的交易比值,那么需要统计从交易开始时间到2015/11/11 11:12:00(不包含该时刻)这一区间内所有的交易值,来计算该整分时刻无线和PC端的比值。

数据构造:

  • 对交易数据进行脱敏处理,对相应字段进行了刷选和整理,随机抽取
    百万级别数据,按照一定的数据格式导入RocketMQ
  • 在RocketMQ中已经堆积好了两种消息,一种是订单消息,一种是支付
    消息,一条订单消息可能对应多条支付消息
  • 两种消息,堆积在三个Topic里面,付款消息堆积在付款Topic,来自天猫的订单消息堆积在天猫订单Topic里,来自淘宝的订单消息堆积在淘宝订单Topic里。

数据格式:订单消息

天猫订单Topic和淘宝订单Topic,都是这样的消息结构。

数据格式:支付消息

一个订单可能分为多次付款,对应多条付款消息,且产生的时间不一致,比如一般来讲来自银行部分的金额比来自支付宝的金额晚到账。赛题中指定的交易时间指的是支付消息的付款时间。

数据的导出和写入:
消息经过kryo序列化事先导入到RocketMq中,选手只要按照定义的数据格式,从Mq中拉取消息,kryo反序列出自己定义的对象,即可。

Tair 存储的是key-value 的结构,key字符串格式, value是number类型。
我们约定key 统一以“固定前缀_整分时间戳”方式命名的字符串,整分时间戳就是整分时刻对应的时间戳,可以表示该一分钟,例2015/11/11 08:11:00分钟对应的时间戳为1447200660(10位数),可表示2015/11/11 08:11:00 ~ 2015/11/11 08:12:00(不包含该时刻)这一分钟。

评判标准
针对两个维度进行评判:
(1) 平均准确度:对每个整分时刻的统计值进行验证,计算每一个统计值的准确度,然后求平均值,得到的就是平均准确度。
(2) 平均耗时:每个统计值的耗时是指从拓扑开始提交,到把这一统值写入Tair这一时段的时长。我们会计算出每个统计值的耗时,求平均值,得到的就是平均耗时。
优先根据平均准确度对各支队伍进行排名,准确度越高的,排名靠前;准确度一样的再根据平均耗时排名,耗时越短的队伍排名靠前。比赛周期每天给出的排名都是根据每只队列历史最优的成绩进行排名的。

初赛环境

备注:集群用容器隔离,可以保证每个拓扑运行间资源相互独立不受影响,同时限制每个拓扑最大可利用Worker数量不超过5个

复赛赛题介绍

赛题:交易订单查询

天猫与淘宝上每天产生了大量的交易订单,这些订单信息需要和其他信息做聚合,提供给各方进行查询。您的挑战是,如何将这些信息组织起来,构建一个简单的查询系统。

数据介绍:

  • 为了保证数据安全,赛题数据使用系统产生的模拟交易数据
  • 一共有三种类型的数据文件,交易信息,买家信息,商品信息。
    文件的每行包含一条记录,记录中包含若干属性列。
    他们通过交易ID,买家ID,卖家ID,商品ID相关联。可以通过类似关系型数据库中join的方式联系在一起
  • 数据文件中的记录之间不保证顺序
  • 数据非常大量,内存肯定放不下

查询方法:

  • 提供交易ID,查询某次交易的某些属性。查询的属性可能不在交易信息中,需要到商品信息或买家信息中查询
  • 查询某位买家某个时间范围内的所有交易信息。输出结果按交易ID排序
  • 对某位卖家某个商品的所有交易信息进行求和,比如查询某个卖家商品的折扣券金额总和或总销售额
  • 查询某位卖家某个商品的所有交易ID及其收货地址

评分标准:

评测环境:

比赛流程

首先进行报名,熟悉比赛产品,并线下测试。
上传代码到 https://code.aliyun.com/,并上传打包脚本,具体规则关注比赛页面。
根据历史最优成绩,每天更新排名。

决赛流程:
1、材料准备:参与答辩队伍需提前准备评审材料,包括PPT材料、代码;
2、评审会:将以现场答辩会的形式进行,具体安排另行通知;
3、最终排名:组委会将根据参赛队伍的代码、历史成绩、评委打分,角逐出冠亚季军,颁发奖金及证书。

参赛规则
参赛对象
面向全社会开放,高等院校、科研单位、互联网企业等人员均可报名参赛。
注:大赛主办和技术支持单位如有机会接触赛题背景业务、产品、数据的员工,则自动退出比赛,放弃参赛资格。

组队规则
参赛队伍可以是单人组队,或者自由组合,但是最多不超过三人。

登陆 tianchi.aliyun.com,立即报名参赛!

时间: 2024-09-23 10:05:35

【干货】零点之战——双十一背后的分布式技术的相关文章

阿里研究员蒋江伟:双十一背后的分布式技术

2016阿里技术论坛于4月15日在清华大学举办,主旨是阐述阿里对世界创新做出的贡献.阿里巴巴集团技术委员会主席王坚,阿里巴巴集团首席技术官(CTO)张建锋(花名:行癫),阿里巴巴集团首席风险官(CRO)刘振飞(花名:振飞),蚂蚁金服首席技术官(CTO)程立(花名:鲁肃)以及来自阿里巴巴集团各部门多位技术大咖齐聚一堂,与莘莘学子分享阿里的技术梦想. 在下午的<电商技术:零到三万亿,从未停止的技术创新>分论坛上,阿里巴巴研究员蒋江伟(花名:小邪)发表了题为<零点之战,双十一背后的分布式技术&

干货分享!2015“双十一”背后的关键技术盘点

时间过的很快,转眼间已近农历新年,回首这一年,盘点技术界的大事件必然离不开双十一这一场技术盛宴.当亿万用户在双十一这一天购物狂欢,屏幕那一头是众多程序员们在努力保障用户每一次点击的客户体验. 通过集结2015年双十一期间从应用服务.中间件.数据库到基础设施等等各层技术人员的一线实战技术分享总结,试图让读者看到双十一背后的人和事,也希望更多技术人从中汲取有益的经验. 技术分享 手淘双十一系列(一) | 521 性能优化项目揭秘@双十一实战   搜索双链路实时计算体系@双十一实战     iGrap

历届双十一背后的技术合集大礼包(陆续更新ing)

双十一后,我们在不断收获惊喜的同时,小编也为大家准备了一份"历届双十一背后技术大起底"礼包!~ 2016年 2016阿里云数据库双11复盘-自动化备战,0干预 聊一聊双十一背后的技术 - 不一样的秒杀技术, 裸秒 聊一聊双十一背后的技术 - 物流, 动态路径规划 聊一聊双十一背后的技术 - 分词和搜索 聊一聊双十一背后的技术 - 毫秒分词算啥, 试试正则和相似度 道哥揭秘 | 双十一背后的安全战斗力 解密阿里云Redis助力双十一背后的技术 Weex:一个志在满足万物互联的移动端技术解

聊一聊双十一背后的技术 - 分词和搜索

双十一背后的技术系列文章 <聊一聊双十一背后的技术 - 物流, 动态路径规划> <聊一聊双十一背后的技术 - 分词和搜索> <聊一聊双十一背后的技术 - 强奸式秒杀技术实现> <聊一聊双十一背后的技术 - 毫秒分词算啥, 试试正则和相似度> 云栖聚能聊 - 聊一聊双十一背后的数据库技术 标签 PostgreSQL , 分词 , 全文索引 , rum , 搜索引擎 , 双十一 , tsvector , tsquery 背景 2016双十一刚过,大伙还在忙着收快

聊一聊双十一背后的技术 - 物流, 动态路径规划

双十一背后的技术系列文章 <聊一聊双十一背后的技术 - 物流, 动态路径规划> <聊一聊双十一背后的技术 - 分词和搜索> <聊一聊双十一背后的技术 - 强奸式秒杀技术实现> <聊一聊双十一背后的技术 - 毫秒分词算啥, 试试正则和相似度> 云栖聚能聊 - 聊一聊双十一背后的数据库技术 标签 PostgreSQL , 物流 , 路径规划 , LBS , PostGIS , Greenplum , 最短路径 , 双十一 , 地理位置信息 , 快递 , 菜鸟物流

聊一聊双十一背后的技术 - 不一样的秒杀技术, 裸秒

聊一聊双十一背后的技术 - 不一样的秒杀技术, 裸秒 作者 digoal 日期 2016-11-17 标签 PostgreSQL , 秒杀 , 裸秒 , ad lock 双十一背后的技术系列文章 <聊一聊双十一背后的技术 - 物流, 动态路径规划> <聊一聊双十一背后的技术 - 分词和搜索> <聊一聊双十一背后的技术 - 强奸式秒杀技术实现> <聊一聊双十一背后的技术 - 毫秒分词算啥, 试试正则和相似度> 云栖聚能聊 - 聊一聊双十一背后的数据库技术 背景

聊一聊双十一背后的技术 - 毫秒分词算啥, 试试正则和相似度

聊一聊双十一背后的技术 - 毫秒分词算啥, 试试正则和相似度 作者 digoal 日期 2016-11-18 标签 PostgreSQL , 正则匹配 , 分词 , 双十一 , rum , trgm , 全文索引 , 搜索引擎 , tsvector , tsquery 双十一背后的技术系列文章 <聊一聊双十一背后的技术 - 物流, 动态路径规划> <聊一聊双十一背后的技术 - 分词和搜索> <聊一聊双十一背后的技术 - 强奸式秒杀技术实现> <聊一聊双十一背后的技

92期:真实电影《双11:零点之战》首次对外公布

本期头条   淘宝造物节:背后VR技术大揭秘! 产业.技术.资本.生态,从2015年下半年开始,似乎全世界的风都吹向了VR.淘宝造物节之后,围绕"场景创新.标准制定.工具优化.GM Lab技术揭秘.创业方向.生态建设"等VR开发者最关心的问题,邀请四位专家录制了云栖说第一期视频节目,赶紧报名. • [采访]阿里云专家:千万别挑活,只要不退缩,一切问题都会有答案 • 真实电影<双11:零点之战>:首次对外公布,阿里七年双11技术备战历程   技术干货   基于深度学习的智能问

真实电影《双11:零点之战》

这是一支神秘的技术战队, 他们工作在代码世界,使用数字语言,搭建程序架构,用特殊的方式触摸人类的极限. 这是一个改变全球互联网格局的故事,在一个世界级的经济现象背后,要经历怎样艰苦卓绝的互联网前沿技术创新? 点击图片,观看视频 真实电影<双十一:零点之战>讲述阿里巴巴神秘技术战队的故事,是阿里巴巴首次对外公布七年双11技术备战历程的纪录大片.从2009年开始到2015年,"双十一"早已成了阿里的一个标志,一个全球消费者的狂欢节.辉煌传奇的背后,有怎样一支强大的技术团队?七年