郭东白:“系统是唐僧,我们是孙悟空”,阿里AliExpress演绎技术版西游记

首届阿里巴巴在线技术峰会(Alibaba Online Technology Summit),将于7月19日-21日 20:00-21:30 在线举办。本次峰会邀请到阿里集团9位技术大V,分享电商架构、安全、数据处理、数据库、多应用部署、互动技术、Docker持续交付与微服务等一线实战经验,解读最新技术在阿里集团的应用实践。

阿里巴巴在线技术峰会专题:
峰会统一报名链接:



阿里巴巴AliExpress(速卖通)技术部总监郭东白,阿里人喜欢称他为阿白。这是一位有16年大型软件系统研发和架构经验,对跨大洲、高可用、高流量服务端软件架构和研发有深入研究的技术大V。他领导设计了全球跨国家、多市场、多语言、多币种、实时个性化、每秒近万笔订单量的多机房异地多活电商平台,连续两年在超过200%流量增速下保持了99.99%的可用性。

16年来修炼的技能:全栈架构、数据供应链和标准化

2001年布朗大学博士毕业后,郭东白到了Oracle做图像检索和医疗图像数据库,同时负责整个Oracle的全球医疗图像标准的组织和参与;2010年离开Oracle,到了Microsoft的医疗事业部,做医疗数据的语言网络、数据供给链和数据挖掘,以及在SQL Server部门做数据市场,也就是做流数据的在云上的售卖系统。之后是亚马逊,做亚马逊即时视频即数字电商。在微软和亚马逊,他还一直在担任相应领域的全球标准领导人和策略制定者。

一直沉浸在跨大洲、高可用、高流量服务端软件架构和研发的郭东白是2014年来到阿里的,现在负责阿里巴巴AliExpress(速卖通)的技术。InfoQ的记者曾好奇地问他为何离开生活了19年的美国,选择来到阿里?他坦言到:“看重的是AliExpress的技术挑战。2014年AliExpress有数十亿美金交易额,全球网站排名前50,日成交下单数千万量级,成交国家200多个。这里面都具有大数据问题的高容量、高复杂度和高速的特征。这样的大体量、高增长的业务对一个技术人员来说是个梦寐以求的天地。回国给了我们相当多展示才能的机会,那种感觉就像,孙悟空逃离五指山下后翻的第一个大筋斗。”

而在被问到整个职业生涯修炼的技能时,他总结为三点:

  1. 全栈架构能力;
  2. 整个数据供给链的知识,这里包括采集、处理、大数据分析、语义和电商体系;
  3. 标准化的软件研发体系。

AliExpress的发展就是一部技术版的“西游记”

如果以“电商系统架构性能优化”为关键词的搜索中,在相关学术文献中有超过3万多篇内容,由此可见持续性热度。但传统性能优化多是关注技术指标,而对最终的业务结果很难量化。对于这个问题,阿里巴巴的AliExpress(速卖通)团队有一个突破性的方案——基于大数据准确度量性能对电商业务的回报的方法。就是说,任何一个微小的局部性能优化(investment)带来的新增订单(return)可以被精确估算出来。所以,在性能上的投入产出比(ROI)就可以被准确的度量出来。这种准确的度量,不但帮助团队更理智的决策在性能的投入,而且带来了新的跨团队、可拆分、并且是可以大规模协同、和跨领域复制的全新的性能优化模式。 因为一个小的性能优化可以局部测试后再分批、分阶段、分团队、跨领域大规模复制。

这也是郭东白本次分享的重点。更是AliExpress所储备的技术能量中的一环。

两年的时间,AliExpress的发展已经印证了郭东白当年的判断。现在,AliExpress线上有近万种移动设备(型号),而App发布不到一年,在全球40多个市场下载量排名第一。谈到最让人激动的技术收获,郭东白认为有两个:“一套系统全球部署,这是个非常大的挑战,我们核心团队协调多个BU,踩了无数的坑的情况下最终完成了这套系统的全球实施;双11:全球压测技术,全球性能监控。”

事实上,前者所指的的是跨州异地双活。在此领域,仅去年就申请了11项专利,这些专利主要集中在区域化部署方向。而AliExpress计划2020年全球零售平台交易额达到6万亿,其中一系列的技术储备中,整个系统已经做到的Scalable就是最为重要的一项。因为这意味着AliExpres可以把一个系统部署到全球几个、几十个,甚至是几百个机房,而相关运营成本却不会成十倍或者是百倍地增长。

郭东白如此评价:“不客气地说,在这个技术上AliExpress已经走在了全球竞争对手的前面。即使在没有业务团队的国家,通过AliExpress全球市场的设计,这一点和Amazon、eBay很不同,我们也可以过数据化运营的方法,而不是铺人铺团队的方法做业务扩张。事实证明这个思路是正确的,这是一场技术的胜利。”

“双11:全球压测技术,全球性能监控”则有一组数据可以分享:“2015年双11那一天,在214个国家和地区有2200万单交易,当时全球有六家大银行被AliExpress的交易量冲垮,但是我们自己的系统在300%的峰值交易量增长面前没有任何闪失。作为一个技术人,我很为自己的团队和系统骄傲!”

郭东白还幽默地将一路上的技术挑战形象地比喻为“西游记”——系统好比唐僧,我们好比孙悟空。孙悟空一不小心,哪怕只是转身吃个桃子,唐僧可能就被妖精抓了去。在AliExpress搭建了全球网络的监控系统中,用红色表示网络有重大故障,绿色表示一切正常。从一年前监控开始到现在,还没有哪一刻全球整个网络全是绿色的。每睡一觉醒来就发现总会出事儿,但是你就是不知道问题出在哪里罢了。就好比我们每天都在打妖精打怪,最大的问题是,怪从哪里冒出来你还真不知道。

读source code学到的知识比较实在

谈到分享的内容, 利用“基于大数据的全球电商系统架构性能优化”的模式,阿里巴巴的AliExpress团队在6个月内带来10.5%的订单增长,并且这个模式被复制到了阿里巴巴全集团十几个BU,其中包括淘宝、天猫、聚划算和阿里云。

AliExpress开发的性能体系有理论支撑,有完整的平台建设,有全球监控能力,有研发组织保障,有在全集团的推广,有长远规划,而且最最重要的是有真金白银的业务回报。我们以开放的心态迎接各种挑战,这里面包括对前沿科学的研究,对相关技术(比如说黑客的动态)的监控,以后有机会都可以来分享。

如果要分享成长中的感悟,郭东白说:“我感觉做全球化业务最关键的一个字就是‘快’。全球市场现在已经是处于一个竞争环境,只要你反应够快,对手再强大你还是有机会的。”

而对于架构师的自我修炼,郭东白的建议是:“不断的实践和学习。我感觉读source code学到的知识比较实在。最后推荐给架构师们一本书: Vanghn Vernon (2013), Implementing Domain Driven Design, Addison Westley。”



7月20日晚8点,欢迎分享到朋友圈,不见不散!

"

议题:《基于大数据的全球电商系统架构性能优化》

议题简介:传统的性能优化往往只注重一个技术指标,最终的业务结果很难量化。本次演讲向大家介绍一个基于大数据准确度量性能对电商业务的回报的方法。也就是说,任何一个微小的局部性能优化(investment)带来的新增订单(return)可以被精确估算出来。因此,我们在性能上的投入产出比(ROI)就可以被准确的度量出来。

这种准确的度量, 不但帮助我们更理智的决策在性能的投入,而且带来了新的跨团队、可拆分、并且是可以大规模协同、和跨领域复制的全新的性能优化模式。 因为一个小的性能优化可以局部测试后再分批、分阶段、分团队、跨领域大规模复制。

利用这种模式,阿里巴巴的AliExpress团队在6个月内通过性能优化带来10.5%的订单增长,并且这个模式被复制到了阿里巴巴全集团十几个BU, 其中包括淘宝、天猫、聚划算和阿里云。

听众受益:

  1. 学习大数据性能建模方法和基于大数据的实时度量性能损耗(因为性能不好而损失的订单占比)方法;
  2. 学习各分项性能指标比如说下单页面白屏,首屏,和全屏加载TP50和TP99数据采集方案和监控方式;
  3. 对比不同优化方案的的结果和投入产出比:比如说专线回源、网络层权威DNS部署、CDN动态加速、AJAX请求合并、网络协议升级和图片编码优化等。


附图:阿里巴巴在线技术峰会整体议程

峰会统一报名链接:

时间: 2024-09-30 01:21:34

郭东白:“系统是唐僧,我们是孙悟空”,阿里AliExpress演绎技术版西游记的相关文章

张纪中版西游记被批:唐僧变黑了妖精很不满

经过和原著的一一对照,不难发现,在造型方面,号称"尊重原著"的张纪中版<西游记>其实并不怎么"尊重"原著. 张纪中版<西游记>自筹拍时起,就打着"尊重原著"的旗号,近日唐僧师徒四人造型 曝光后,其宣传负责人在接受采访时更是表示:"造型师非常尊重原著,越到后面,肯定越精彩."那么张版<西游记>到底有多么"尊重原著"呢?不妨就现在放出的造型逐个探讨. 首先来看唐僧.这次的张版

【阿里在线技术峰会】郭东白:基于大数据的全球电商系统性能优化

本文根据郭东白在首届阿里巴巴在线技术峰会上的分享整理而成.他首先介绍了AliExpress电商系统的理论基础,通过页面间跳出率的计算引出了全栈优化的思路.然后,他介绍了AliExpress平台的设计思路和性能优化过程.紧接着,他分享了AliExpress使用过的几个有效的优化策略:动态加速.静态化+ESI.元素合并请求.CDN调度优化等.最后,他用实例展示了性能优化带来的结果,并对架构设计的过程提出了几点思考和总结. 直播视频:点此进入 PDF下载:点此进入 以下为整理内容. 整个系统的理论基础

阿里技术高P访谈之郭东白:与“大象”共舞的技术狂人

在郭东白眼中,AliExpress就是一头狂奔的大象,令他惊讶.好奇,甚至是"恐怖".也正因为如此,他才毅然决定回国,要与这头"大象"共舞. "大象"的超级引力  大约两年前,阿里的HR联系上郭东白,向他大致介绍了AliExpress.然而就这一次看似平常的沟通,却引发了他巨大的兴趣. "你知道那种感觉吗?"郭东白向笔者说,"这是我之前从未听说过的一个奇迹!" AliExpress,也就是"全球速

CentOS系统更换软件安装源 为阿里云

CentOS系统更换软件安装源 为阿里云   阿里云是最近新出的一个镜像源.得益于阿里云的高速发展,这么大的需求,肯定会推出自己的镜像源. 阿里云Linux安装镜像源地址:http://mirrors.aliyun.com/ 第1步:备份你的原镜像文件,以免出错后可以恢复.(字母需要区分大小写) mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup 第2步:查找系统的版本号,方便到阿里云上找对版

无能的唐僧 为什么是孙悟空的领导

小时候读西游记总有一个疑问--唐僧那么无能,为什么孙悟空非要带着他去取经呢?如果孙悟空自己去取经,不就麻烦少多了么?后来长大了,工作了,先被人领导,之后又领导别人,总算明白了,原来唐僧领导孙悟空是有道理的.如果不是这样,取经这项伟大的事业就不能成功了. 那么唐僧究竟有什么东西,是孙悟空没有的呢?究竟是什么因素让唐僧是一个领导,而孙悟空只是一个打工者呢? 1."崇高信念" 第一个东西,唐僧有,而孙悟空没有的是"崇高信念".唐僧在自己的崇高信念面前,丢掉性命都不会眨眼,

当公众平台系统恢复之后,我们会重新推送早间版的8点1氪

今天早晨当我们想推送早间版的8点1氪时,发现微信公众平台无法登陆. 先是登陆时提示"系统错误,请稍后再试",接着出现504页面.现在36氪办公室的网络已无法打开公众平台后台页面. 其他媒体也遇到同样的故障.本来早晨应该会收到很多媒体的推送消息,但是今天早晨却只收到一条腾讯科技的,猜测他们使用的是不同的后台? 也有用户反馈说早晨用户端的微信也无法使用,不能刷新朋友圈,不能登陆网页版微信等. 微信官方已经发表声明,称: "由于服务器基础网络故障,您的微信暂时可能出现收发问题.我们

阿里云服务器window版安装解压免安装版mysql,出现系统错误2:系统无法找到指定文件

问题描述 在阿里云服务器中,系统为windowsServer2012安装解压版mysql,版本为mysql-5.7.11-winx64.ini配置文件中有修改为控制台中在指定目录中输入相应命令后出现系统环境变量Path中也添加了对应的路径,请大神帮忙解决

需求、系统、动机如何满足?阿里云推荐系统架构深度解析

为什么做推荐? 推荐本质上并不是一个很新的话题.从很早开始,尤其从互联网出现之后,大家面临一个问题,我们怎么样从海量的数据里获得自己需要的内容?这实际上也经历了很长的过程,最开始的时候并不是推荐,而是分类导航.做分类导航最好的公司就是雅虎,那个时候互联网的数据还不是特别多,可以通过人工或者一些简单的分类方法整理出一个目录出来,大家就可以按这个目录一层层往下走,比在原来在网上找好很多.但分类导航由于分类的标准不一样,人和人认知的差异性,后来谷歌的出现促使了雅虎在这个领域的沉寂. 搜索就是下一代解决

Windows系统下MySQL添加到系统服务方法(mysql解压版)_Mysql

MySQL软件版本:64位 5.7.12 1.首先配置MySQL的环境变量,在系统环境变量Path的开头添加MySQL的bin目录的路径,以";"结束,我的路径配置如下: 2.修改MySQL根目录下的my-default.ini文件的内容:主要修改2个属性:basedir和datadir. basedir:MySQL的根目录: datadir:数据库数据的保存目录(目录需要手动创建): 需要注意的几点: 目录的斜杠最好用反斜杠,要不需要转义或者加双引号: datadir的目录必须事先创