京东技术架构(一)构建亿级前端读服务

从入职京东到现在,做读服务已经一年多的时间了,经历了各种亿级到百亿级的读服务;这段时间也进行了一些新的读服务架构尝试,从架构到代码的编写,各个环节都进行了反复尝试,压测并进行调优,希望得到一个自己满意的读服务架构。

一些设计原则

  • 无状态
  • 数据闭环
  • 缓存银弹
  • 并发化
  • 降级开关
  • 限流
  • 切流量
  • 其他

无状态

如果设计的应用是无状态的,那么应用就可以水平扩展,当然实际生产环境可能是这样子的: 应用无状态,配置文件有状态。比如不同的机房需要读取不同的数据源,此时就需要通过配置文件指定。

数据闭环

如果依赖的数据来源特别多,此时就可以考虑使用数据闭环,基本步骤:

1、数据异构:通过如MQ机制接收数据变更,然后原子化存储到合适的存储引擎,如redis或持久化KV存储;

2、数据聚合:这步是可选的,数据异构的目的是把数据从多个数据源拿过来,数据聚合目的是把这些数据做个聚合,这样前端就可以一个调用拿到所有数据,此步骤一般存储到KV存储中;

3、前端展示:前端通过一次或少量几次调用拿到所需要的数据。

这种方式的好处就是数据的闭环,任何依赖系统出问题了,还是能正常工作,只是更新会有积压,但是不影响前端展示。

另外此处如果一次需要多个数据,可以考虑使用Hash Tag机制将相关的数据聚合到一个实例,如在展示商品详情页时需要:商品基本信息:p:123:, 商品规格参数:d:123:,此时就可以使用冒号中间的123作为数据分片key,这样相同id的商品相关数据就在一个实例。

 

缓存银弹

缓存对于读服务来说可谓抗流量的银弹。

浏览器端缓存

设置请求的过期时间,如响应头Expires、Cache-control进行控制。这种机制适用于如对实时性不太敏感的数据,如商品详情页框架、商家评分、评价、广告词等;但对于如价格、库存等实时要求比较高的,就不能做浏览器端缓存。

CDN缓存

有些页面/活动页/图片等服务可以考虑将页面/活动页/图片推送到离用户最近的CDN节点让用户能在离他最近的节点找到想要的数据。一般有两种机制:推送机制(当内容变更后主动推送到CDN边缘节点),拉取机制(先访问边缘节点,当没有内容时回源到源服务器拿到内容并存储到节点上),两种方式各有利弊。 使用CDN时要考虑URL的设计,比如URL中不能有随机数,否则每次都穿透CDN,回源到源服务器,相当于CDN没有任何效果。对于爬虫可以返回过期数据而选择不回源。

接入层缓存

对于没有CDN缓存的应用来说,可以考虑使用如Nginx搭建一层接入层,该接入层可以考虑如下机制实现:

1、URL重写:将URL按照指定的顺序或者格式重写,去除随机数;

2、一致性哈希:按照指定的参数(如分类/商品编号)做一致性Hash,从而保证相同数据落到一台服务器上;

3、proxy_cache:使用内存级/SSD级代理缓存来缓存内容;

4、proxy_cache_lock:使用lock机制,将多个回源合并为一个,减少回源量,并设置相应的lock超时时间;

5、shared_dict:此处如果架构使用了nginx+lua实现,可以考虑使用lua shared_dict进行cache,最大的好处就是reload缓存不丢失。

此处要注意,对于托底/异常数据不应该让其缓存,否则用户会在很长一段时间看到这些数据。

应用层缓存

如我们使用Tomcat时可以使用堆内缓存/堆外缓存,堆内缓存的最大问题就是重启时内存中的缓存丢失,如果此时流量风暴来临可能冲垮应用;还可以考虑使用local redis cache来代替堆外内存;或者在接入层使用shared_dict来将缓存前置,减少风暴。

分布式缓存

一种机制就是废弃分布式缓存,改成应用local redis cache,即在应用所在服务器中部署一个redis,然后使用主从机制同步数据。如果数据量不大这种架构是最优的;如果数据量太大,单服务器存储不了,还可以考虑分片机制将流量分散到多台;或者直接就是分布式缓存实现。常见的分片规则就是一致性哈希了。


如上图就是我们一个应用的架构:

1、首先接入层读取本地proxy cache / local cache;

2、如果不命中,会读取分布式redis集群;

3、如果还不命中,会回源到tomcat,然后读取堆内cache;如果没有,则直接调用依赖业务获取数据;然后异步化写到redis集群;

因为我们使用了nginx+lua,第二、三步可以使用lua-resty-lock非阻塞锁减少峰值时的回源量;如果你的服务是用户维度的,这种非阻塞锁不会有什么大作用。

并发化

假设一个读服务是需要如下数据:

1、数据A  10ms

2、数据B  15ms

3、数据C   20ms

4、数据D   5ms

5、数据E   10ms

那么如果串行获取那么需要:60ms;

而如果数据C依赖数据A和数据B、数据D谁也不依赖、数据E依赖数据C;那么我们可以这样子来获取数据:

那么如果并发化获取那么需要:30ms;能提升一倍的性能。

假设数据E还依赖数据F(5ms),而数据F是在数据E服务中获取的,此时就可以考虑在此服务中在取数据A/B/D时预取数据F,那么整体性能就变为了:25ms。

降级开关

对于一个读服务,很重要的一个设计就是降级开关,在设计降级开关时主要如下思路:

1、开关集中化管理:通过推送机制把开关推送到各个应用;

2、可降级的多级读服务:比如只读本地缓存、只读分布式缓存、或者只读一个默认的降级数据;

3、开关前置化:如架构是nginx—>tomcat,可以将开关前置到nginx接入层,在nginx层做开关,请求不打到后端应用。

限流

目的是防止恶意流量,恶意攻击,可以考虑如下思路:

1、恶意流量只访问cache;

2、对于穿透到后端应用的可以考虑使用nginx的limit模块处理;

3、对于恶意ip可以使用如nginx deny进行屏蔽。

大部分时候是不进行接入层限流的,而是限制流量穿透到后端薄弱的应用层。

切流量

对于一个大型应用,切流量是非常重要的,比如多机房有机房挂了、或者有机架挂了、或者有服务器挂了等都需要切流量,可以使用如下手段进行切换:

1、DNS:切换机房入口;

2、LVS/HaProxy:切换故障的nginx接入层;

3、Nginx:切换故障的应用层;

另外我们有些应用为了更方便切换,还可以在nginx接入层做切换,通过nginx进行一些流量切换,而没有通过如LVS/HaProxy做切换。

其他

不需要cookie的应用使用无状态域名,如3.cn;

接入层请求头过滤,只转发有用的请求头到后端应用;

数据过滤逻辑前置,比如在接入层进行请求参数的合法性过滤;

内网设置合理的连接、读、写超时时间;

根据需要开启gzip压缩减少流量;

使用unix domain socket减少本机连接数;

内网考虑使用http长连接;

响应请求时,考虑响应头加上服务器ip等信息,方便调试。

 

我们处理的读服务大部分都是KV的,因此抗流量的思路就是大量缓存;而且怎么让缓存怎么更接近用户,离用户越近速度就越快。再一个点就是要考虑好降级方案,在异常情况下应用不被拖垮拖死。我们系统大量使用了如nginx+lua+redis技术,使用这些技术解决了我们很多读服务问题。

时间: 2024-07-28 12:33:29

京东技术架构(一)构建亿级前端读服务的相关文章

京东技术架构(二)构建需求响应式亿级商品详情页

该文章是根据velocity 2015技术大会的演讲<京东网站单品页618实战>细化而来,希望对大家有用. 商品详情页是什么 商品详情页是展示商品详细信息的一个页面,承载在网站的大部分流量和订单的入口.京东商城目前有通用版.全球购.闪购.易车.惠买车.服装.拼购.今日抄底等许多套模板.各套模板的元数据是一样的,只是展示方式不一样.目前商品详情页个性化需求非常多,数据来源也是非常多的,而且许多基础服务做不了的都放我们这,因此我们需要一种架构能快速响应和优雅的解决这些需求问题.因此我们重新设计了商

振兴云存储 中国亿级并发云服务器量产

根据<科技日报>报道,中科曙光(603019,股吧)29日在天津宣布,曙光星河云服务器系统正式量产.这是我国首款亿级并发云服务器系统,同时也是世界目前最强的云服务器产品. 据悉,曙光星河云服务器系统采用全新的国产设计体系架构,与传统架构相比,曙光星河云服务器系统的节点性能功耗比提升3倍以上,成本降低70%,系统复杂性降低60%,与业内最好的传统架构服务器相比,空间占用减少50%. 目前,曙光星河云服务器系统目前已在中国电信的天翼云.中国银联的联云平台.中国教育电视台的教育新媒体云上进行了部署应

小米架构师:亿级大数据实时分析与工具选型

本文根据欧阳辰老师在[2016 DAMS中国数据资产管理峰会]现场演讲内容整理而成.   讲师介绍 欧阳辰,超过15年的软件开发和设计经验,目前就职于小米公司,负责小米广告平台的架构研发. 曾为微软公司工作10年,担任高级软件开发主管,领导团队参与微软搜索索引和搜索广告平台的研发工作.曾在甲骨文公司从事数据库和应用服务器的研发工作.热爱架构设计和高可用性系统,特别对于大规模互联网软件的开发,具有丰富的理论知识和实践经验. 大家好,很高兴能跟大家分享一些关于实时数据分析的话题. 刚毕业时我有幸去了

Serverless技术架构——极简运维,无限扩容

      移动互联网.物联网和大数据应用的快速发展极大地促进了人们对云计算的需求.但是让应用架构拥有良好的可伸缩性和高可用性并非易事,运维和管控庞大的基础架构更是极大的挑战.       近年来,一个新的架构风格Serverless成了热门话题.本文基于Serverless概念的提出者Martin Fowler对Serverless概念的解读,全面阐述Serverless架构与传统架构的区别,优势及具体应用场景. 1. Serverless的概念 Serverless是一种基于互联网的技术架构

数据库、架构、移动、机器学习,蚂蚁金服与阿里云技术布道亿级互联网金融实践

随着云计算.移动.活的大数据.机器学习算法的进展,人工智能正在经历巨大的突破.人工智能已经成为很多业务的驱动力,并且开始在金融服务中发挥力量. 蚂蚁金服致力于创新金融技术,并且用新技术为大众和小微企业提供普惠金融服务. 8月30-31日,一场别开生面的技术大会-"蚂蚁金服&阿里云在线金融技术峰会"( https://yq.aliyun.com/activity/109)将在线举办.聚焦数据库.应用架构.移动开发.机器学习等热门领域,为金融业技术开发者深入解析互联网应用的前沿应用

为支持亿级用户,短视频应用应该如何打造技术架构?

本文系美图架构师麦俊生,在Boss直聘主办的直聘学院「对话架构师」活动上的分享整理,介绍短视频社交"美拍"架构实践的总结. 麦俊生,Boss直聘「直聘学院」特邀分享嘉宾.美图架构平台深圳技术总监,曾担任新浪微博.奇虎360技术专家,从事高性能高可用架构设计开发工作,参与建设微博的feed和私信im系统.负责rpc框架motan.cache service. counter service.公用类库等基础建设,以及奇虎360存储服务和基础框架方面的建设.个人擅长性能调优.高可用中间件.分

【转】构建需求响应式亿级商品详情页

商品详情页是什么 商品详情页是展示商品详细信息的一个页面,承载在网站的大部分流量和订单的入口.京东商城目前有通用版.全球购.闪购.易车.惠买车.服装.拼购.今日抄底等许多套模板.各套模板的元数据是一样的,只是展示方式不一样.目前商品详情页个性化需求非常多,数据来源也是非常多的,而且许多基础服务做不了的都放我们这,因此我们需要一种架构能快速响应和优雅的解决这些需求问题.因此我们重新设计了商品详情页的架构,主要包括三部分:商品详情页系统.商品详情页统一服务系统和商品详情页动态服务系统:商品详情页系统

空格App亿元A轮融资背后:云上多场景技术架构实践与经验

直播视频: (点击图片观看) 幻灯片下载地址: https://oss.aliyuncs.com/yqfiles/382bc642fc0b621a9368138a74d8fd36.pdf 阿里云在空格   图一 空格服务端整体架构   在空格初始创业阶段,人员十分缺乏,但依靠着阿里云,空格两周便实现APP上线.空格服务端整体架构包括在线和离线两大部分.在线服务端的前端包括用户服务端集群.商家服务端集群和IM PUSH集群:在线服务端的后端由搜索/推荐引擎集群组成:架构底层的存储采用传统的MySQ

亿级流量电商详情页系统实战:缓存架构+高可用服务架构+微服务架构

<缓存架构+高可用服务架构+微服务架构>深入讲解了亿级流量电商详情页系统的完整大型架构.同时最重要的是,在完全真实的大型电商详情页系统架构下,全流程实战了整套微服务架构,包含了基于领域驱动设计进行微服务建模.Spring Cloud.基于DevOps的持续交付流水线与自动化测试套件.基于Docker的自动化部署.此外,还包含了大型电商详情页系统架构中的多种复杂架构设计的详细介绍. <亿级流量电商详情页系统实战(第一版)>的内容,主要是基于简化以后的大型电商详情页系统的背景,重点包含