阿里自研实时计算平台支撑双十一

 本文讲的是阿里自研实时计算平台支撑双十一阿里巴巴11月7日宣布,其大数据团队自研的实时数据计算平台Galaxy ,目前每秒可运算数据超过500万条,预计双十一当天每秒运算量将超过1000万条,日处理消息数将超过1万亿条。针对每一笔交易数据,系统将实时反复检测70余次以保证数据质量。

  一分钟成交破亿,一千多万人涌入天猫。这是2013双十一购物狂欢节第一分钟的战况。这些数据在杭州淘宝城内的数据大屏实时播报。大屏上跳动的每个数字,来自于阿里内部60多个系统间的紧密合作:当你在以最快速度秒杀到双十一热卖商品的同时,这些系统已经完成了无数轮的数据采集、传输、加工、计算以及反馈到页面的工作。这正是阿里未曾公开的技术--如何在保障数据质量的前提下实现实时计算?

  Galaxy是阿里巴巴自研的通用增量计算平台,能提供从分钟级别到秒级别、甚至毫秒级别延迟的实时数据计算能力。Galaxy解决了计算通用性、开发成本、数据质量等诸多难题,并提供可扩展、规模化的集群服务能力。

  目前,Galaxy每秒可计算数据已达500万条,每日处理的记录数超过2500亿,日处理数据量近2PB。想象一下:当你还在努力算出1024×1024等于多少时,这一秒钟内Galaxy已经拿到数据、计算结束、交出结果这一整套流程500万遍了。今年双十一,用户浏览、成交、手机APP等产生的数据量都将大规模增长。当天Galaxy的运算量预计每秒将超过1000万,日处理消息数将超过1万亿条。

  阿里巴巴数据质量团队介绍:“Galaxy不光要算得快,还得保证不能算错。”除了Galaxy之外,阿里研发了一套可以实时检测线上数据的系统,能够在1秒钟以内完成从数据产生到校验的过程,每笔交易可以实时建议70多次,以保障双十一的数据不会算错。

  比如,一个美国用户在双十一活动下单,刚付完款,可能由于国际间网络突然闪断,导致"已付款"状态数据没有传输回来。这时,呈现给买家的可能就是"交易失败"的状态。但通过数据实时检测系统,能在这个问题被消费者发现之前就开始报警进行处理。也许,还没消费者回过神来,这个问题就已经被纠正,丝毫感受不到"交易失败"曾经出现过。

  此外,Galaxy还设计了数据"防漏"措施,哪怕服务器突然宕机,也能保障数据不丢失,快速恢复后继续工作。想象一下:如果在你跟朋友约好晚上看电影的时候,你突然发了一场高烧昏厥过去,正常情况下,要去医院才能治好,并且得休息好几天。Galaxy不仅能自我修复,而且还能将时光倒回到那个晚上,你和朋友继续去看电影。

  目前,Galaxy已逐步支撑阿里集团绝大部分的实时业务和应用,包括淘宝、天猫、阿里云、菜鸟、聚划算、无线、搜索、广告、数据魔方等业务提供实时计算服务。

原文发布时间为:2014-11-06 

本文作者:景保玉

原文标题:阿里自研实时计算平台支撑双十一

时间: 2025-01-21 14:37:41

阿里自研实时计算平台支撑双十一的相关文章

如何基于Spark Streaming构建实时计算平台

1.前言 随着互联网技术的迅速发展,用户对于数据处理的时效性.准确性与稳定性要求越来越高,如何构建一个稳定易用并提供齐备的监控与预警功能的实时计算平台也成了很多公司一个很大的挑战. 自2015年携程实时计算平台搭建以来,经过两年多不断的技术演进,目前实时集群规模已达上百台,平台涵盖各个SBU与公共部门数百个实时应用,全年JStorm集群稳定性达到100%.目前实时平台主要基于JStorm与Spark Streaming构建而成,相信关注携程实时平台的朋友在去年已经看到一篇关于携程实时平台的分享:

基于Docker的京东大数据实时计算平台

JRC用户需求多样复杂,用户要求的资源配置也大小不一,系统更新部署步骤繁琐,人工操作亦有极大的安全风险,与此同时,用户的资源需求也越来越多,大集群支持.资源节省亦是我们应该重点关注的问题. 本文就来介绍一种我们京东为了解决上述问题而研发的基于docker的实时计算平台. 现状以及问题 storm集群结构: storm拓扑结构: storm瓶颈 从storm架构图可以看出,storm整个集群对zookeeper的依赖非常大,无论是拓扑配置.分配信息.心跳.错误信息,均存储在zookeeper中,而

阿里云道哥解密:保卫“双十一”的技术牛在哪里 | 硬创公开课

       有一个节日,是女人的狂欢日,也是女人背后男人的流泪日: 有一种冲动的激情,叫"买买买"! 这群甚至被誉为马云背后的女人,撑起了电子商务的一片天. 但是,你一定不知道的是,马云背后还有一个男人,在为这个盛大的购物狂欢节保驾护航. 这个男人,就是阿里云云盾的负责人吴翰清,人称"道哥". 他是黑客道哥,也是"道哥的黑板报"的"文艺网红".保卫阿里云这个中国 35% 的网站都坐落其上的云计算平台和上面的居民,道哥觉得自己

预告! 阿里云道哥:如何保卫“双十一” | 硬创公开课

       有一个节日,是女人的狂欢日,也是女人背后男人的流泪日: 有一种冲动的激情,叫"买买买"! 这群女人,甚至被誉为马云背后的女人,撑起了电子商务的一片天. 但是,你一定不知道的是,马云背后还有一个男人,在为这个盛大的购物狂欢节保驾护航. 这个男人,就是阿里云云盾的负责人吴翰清,人称"道哥". 他是黑客道哥,也是"道哥的黑板报"的"文艺网红".保卫阿里云这个中国 35% 的网站都坐落其上的云计算平台和上面的居民,道哥觉

“吃货节”能否成为生活服务平台的双十一?

电商企业喜欢"造节",像阿里巴巴的双十一.双十二,京东6·18和苏宁的8·18,现在像大众点评.糯米等生活服务类网站也加入了这一行列,造节营销能给这些平台带来类似电商双十一的效果吗? 5月17日下午,<第一财经日报>记者从大众点评方面了解到,点评的首个吃货节从15日持续到17日,横跨周五和双休日这3天.15日当天的餐饮成交额突破了2亿元,200万用户参与,近百万份免费吃大餐团购2小时即被抢购一空.首日累计售出火锅26万份.自助餐20万份.江浙菜19.5万份.日韩料理13万份

阿里CEO陆兆禧:我们开创了双十一

350.19亿支付宝总交易额,超过1.5亿件包裹,中国80%以上的快递订单,刚刚过去的第五个双十一,阿里拿出了这样一份成绩单.数字很不错,但是不重要.我们看重的是,这个数字是不是健康,是不是社会能够承受,是不是能够为未来更快速的发展奠定基础.我们追求的是社会资源的协同和释放. 双十一,我们只是一个参与者.我们唯一可以用来骄傲的是我们开创了双十一,让消费者和商家一起玩儿起来.所有的表扬,都属于商家.消费者.快递员等参与者:我们以此来感恩这个时代,感恩这个社会! 350亿对于传统行业来说可能是个大数

【干货】强琦:阿里实时计算平台解析,30PPT

原文发布时间为:2015-01-09

阿里自研UED计件平台技术解析

从天猫到菜鸟,从双11到造物节,在阿里巴巴,除了来自集团的UED团队外,还有一支700余人的外包团队,一起创造着阿里视觉神话.阿里的UED外包同学们每年会收到来自阿里巴巴集团50多个业务方提出的十余万外包需求.如何协调外包设计师与需求方之间的配合,并且给到外包同学合理结算价格,成为阿里UED外包管理的一大难点. 以往,阿里巴巴也会用一些简单的需求分发系统来应对.但由于实际业务场景的复杂性,需求在分配上无法做到合理与精准.加上缺乏评价和追踪体系,外包同学的执行效果得不到监控,最后形成的素材也难以沉

【ATF】钱正平:大规模实时计算及其在阿里的应用与创新

2016 ATF阿里技术论坛于4月15日在清华大学举办,主旨是阐述阿里对世界创新做出的贡献.阿里巴巴集团技术委员会主席王坚,阿里巴巴集团首席技术官(CTO)张建锋(花名:行癫),阿里巴巴集团首席风险官(CRO)刘振飞(花名:振飞),蚂蚁金服首席技术官(CTO)程立(花名:鲁肃)以及来自阿里巴巴集团各部门多位技术大咖齐聚一堂,与莘莘学子分享阿里的技术梦想. 阿里云高级专家 钱正平正在分享<大规模实时计算及应用> 在下午的<云计算和大数据>分论坛中,阿里云高级专家钱正平(花名:布民)