云数据库memcached之热点key问题解决方案

背景

在分布式K-V存储系统中，对某个key进行读写时，会根据该key的hash计算出一台固定的server来存取该K-V，如果集群不发生服务器数量变化，那么这一映射关系就不会变化。
云数据库memcached就是这样一种K-V缓存系统。因此在实际应用中，某些高峰时段，有的云数据库memcached用户会大量请求同一个Key（可能对应应用的热卖商品、热点新闻、热点评论等），所有的请求（且这类请求读写比例非常高）都会落到同一个server上，该机器的负载就会严重加剧，此时整个系统增加新server也没有任何用处，因为根据hash算法，同一个key的请求还是会落到同一台新机器上，该机器依然会成为系统瓶颈。这个问题称为“热点key”问题。

现状

用户使用云数据库memcached就是为了提升业务性能，难免会触发“热点key问题”。但云数据库memcached做为公有云服务，在发现有热点的情况下，如果继续放任该热点无限激增，就会带来整个系统雪崩似宕机。所以当前的做法会对每个用户在每台服务器上分配一定的QPS或带宽，当用户在某台服务器上的请求超过该用户的配额，我们就会对用户进行流控，服务端返回TEMPORARY_FAILURE。该限制会影响用户正常请求，持续时间分钟级。

思考

用户触发热点问题是业务需要，是理所当然；云数据库memcached对热点key进行流控是保障系统稳定性，也在情理之中。但有没有一种既能提供用户热点key访问的需求，又能保护云数据库memcached服务器的方法，正是本文所要阐述的。
解决热点问题有很多办法，比如用户如果提前知道某些key可能成为热点，那么客户端可以提前拆分热点key；也可以搭建一个备用集群，写的时候双写，然后随机双读。这些方案的实现前提和难度，可想而知。下面给出的是对应用透明，且动态发现热点的解决方案。

解决方案

整体思路

本方案解决的是用户读热点问题，不解决写热点问题。
首先，云数据库memcached简单架构图如下：

我们的proxy是无状态层，上面做了些访问控制功能，用户客户端到proxy是随机的，不受固定算法（如hash）控制。而proxy到DataServer的链路是根据key决定的，当用户访问热点key时，所有proxy上关于该key的请求都会落到同一台DataServer。
所以解决热点问题，其核心思路是：每台DataServer对所有key进行采样、定位，实时计算出当前热点key，将其反馈给proxy层，由proxy缓存备份。即负载压力由DataServer转向proxy。理由是：Proxy可以无状态扩容，而DataServer不可以。

DataServer如何发现热点

每台服务器有个HotKey逻辑，让每个到达服务器的目标请求（可配置不同类型请求）经历三个流水阶段：
a. 采样阶段（根据配置设定采样次数sample_max）
本阶段输出：是否有热点现象，如果有热点，输出热点的桶号供下阶段使用。

b. 定位阶段（根据配置设定采样次数reap_max）
本阶段输出：热点key（如果满足阈值）。并添加到服务端的LRU链表。

c. 反馈阶段
对到达服务器的目标请求，取出key，然后查询LRU链表判断该key是否为热点key。如果是热点，就会在请求结束后，向proxy发送一个feedback包，通知proxy。
至此，服务器hot-key逻辑结束。流程图如下：

发现热点后proxy怎么处理

当Proxy收到DataServer的热点反馈之后，会将该key写入到自己的LRU-cache里面，该cache的过期时间和容量大小都交由用户通过控制台设置，默认分别是100ms和30。这样，热点的key就已经存在于与proxy中了，下次用户请求就可以直接返回了。

如何保证数据一致性呢？

下面讨论都是用户client已经触发了热点key问题，假设用户client跟每个proxy都建立了链接，并且每个proxy上都有对热点key的请求，那么理论上每个proxy的LRU-cache都有一份数据。
我们保证单条连接上的一致性。
当用户client和proxy1建立连接，用户修改了一个key（任何写操作），proxy1上会在LRU-cache中同步删除该key，新key就会写到DataServer上，然后在读数据的时候，由于LRU-cache不命中，就会从DataServer上拿到最新数据。
不同链接上只能提供弱一致性。
如果这个时候用户从proxy2上读热点数据呢？理论上就会读到老数据，该数据将于100ms之后从proxy-cache中过期淘汰掉，之后就会更新会最新数据，即不同连接间可能有100ms不一致。
怎样看待弱一致性。
事实上，不开启热点key功能，在不同链接上也会存在弱一致。假设用户client建立了两条链接到云数据库memcached，在链接1上写入key-value1，在链接1、2上分别读该key。当链接1上用户update了key-value2，这个请求需要一定的网络延迟才能写入到服务端，如果这个时候链接2上同时发起对key的读取操作，如果读请求先到服务端，它将读到的是value1的老值。
所以开启热点key功能，只是增加了不一致时间，且该功能为可选。控制权由用户掌握。

适用场景

由以上分析可以看到，开启热点key功能之后，只会对用户的读请求产生影响，该影响增加了不同链接上的弱一致性的时间。因此，该功能适合读多写少，且对强一致性要求不高的应用。

收益

整个方案核心是负载压力由DataServer转移到Proxy。好处如下：
1、因为DataServer扩容也解决不了热点问题，而Proxy可以无状态扩容，对用户来讲就极大提升了热点key访问的能力，不受单点制约。
2、缩短了服务端处理链路，对用户平均RT也所降低。
3、免除服务端热点流控的分钟级别影响。

时间： 2024-10-31 09:34:02

云数据库memcached之热点key问题解决方案的相关文章

Memcached · 最佳实践 · 热点 Key 问题解决方案

背景在分布式K-V存储系统中,对某个key进行读写时,会根据该key的hash计算出一台固定的server来存取该K-V,如果集群不发生服务器数量变化,那么这一映射关系就不会变化. 云数据库 memcached 就是这样一种K-V缓存系统.在实际应用中的某些高峰时段,有的云数据库 memcached 用户会大量请求同一个Key(可能对应应用的热卖商品.热点新闻.热点评论等),所有的请求(且这类请求读写比例非常高)都会落到同一个server上,该机器的负载就会严重加剧,此时整个系统增加新serv

一分钟了解阿里云产品：云数据库Memcache版

一. 概述阿里云产品种类繁多,今天让我们一起来了解下云数据库Memcache版(AliCloudDB for Memcache,原OCS)吧. 什么是云数据库Memcache版呢? 一句话,云数据库Memcache版是基于内存的缓存服务,支持海量小数据的高速访问. 那么,云数据库Memcache有什么优势呢?我来给大家说说吧. 云数据库Memcache可以极大缓解对后端存储的压力,提高网站或应用的响应速度.云数据库Memcache支持Key-Va

阿里云双11访谈之云数据库

以下内容根据访谈视频整理而成. 阿里云数据库产品特性介绍云数据库产品在阿里云集团里做了很多额外的工作和专研.在安全线上云数据库达到了很高的安全要求,引入了更多的硬件,在架构上.在代码层都做了很多的优化.相对于传统数据出来说,云数据库在稳定性和高可用上面达到了较高的技术上的提升.阿里云产品都有一个通用特性就是应用可以快速实现自动化,实现对实例级别的管理.监控,对程序的迁移.阿里云云数据库团队不仅在业界上是顶级的专家团队,在专业上也是属于国内顶级的水平,阿里云数据库为用户在云上的业务做保驾护航的工

一分钟了解阿里云产品：云数据库Redis版

一. 概述阿里云发布了很多款产品,几天让我们来一起了解下云数据库Redis版(AliCloudDB for Redis)吧. 什么是云数据库Redis呢? 运输库Redis是兼容开源Redis协议的Key-Value类型在线存储服务.云数据库Redis版支持字符串.链表.集合.有序集合.哈希表等多种数据类型,及事务(Transactions).消息订阅与发布(Pub/Sub)等高级功能.通过内存+硬盘的存储方式,云数据库Redis版在提供高速数据读写能力

云数据库Redis版备份恢复解决方案上线，数据可靠性全面升级！

阿里云云数据库Redis版致力于为用户提供稳定可靠.性能卓越.可弹性伸缩的数据库服务,并提供全套的容灾切换.故障迁移.在线扩容.性能优化的数据库解决方案. 云数据库Redis版采用双击热备的架构保证服务高可用,并且提供了持久化机制来保证数据可靠性.但是随着越来越多的业务开始使用Redis作为最终的持久化存储引擎,用户对于数据可靠性就提出了更高的需求.经过一段时间的打磨,我们正式推出了Redis备份恢复解决方案,全面的升级云数据库Redis的数据可靠性. 1. 数据备份一键式操作由于

云数据库Redis游戏行业解决方案解读

Redis作为最流行的Key-value数据库,近年来在游戏行业有着广泛的应用.阿里云云数据库Redis于2015年正式商业化,提供了全套的容灾切换.故障迁移.在线扩容.性能优化的数据库解决方案,同时也对游戏行业推出了许多便捷的功能. 下面我就来解读云数据库Redis版针对游戏行业的特性 1.数据持久化,保证数据高可靠性传统的数据库架构往往是采用关系型数据库存储数据(如:MySQL),在MySQL前端利用缓存来存储访问量极高的数据(如:Redis),整体提升系统性能. 然而有时游戏公司为了快速

彩虹桥——云数据库Greenplum版数据同步解决方案

云数据库Greenplum版(ApsaraDB for Greenplum)目前已经开始公测,大家对它的使用评价还是非常高的.但是也有看到朋友反映说在把业务数据同步到云数据库的过程中还有一些不那么灵活的地方.就在前几天,笔者经朋友推荐在阿里云市场找到了这款叫彩虹桥的软件,在用了一段时间后,想在此提一些自己的看法.言而总之在业务数据同步方面,笔者认为彩虹桥应该是greenplum目前最好用的配套辅助工具. 首先让我们来看看正在公测的云数据库Greenplum版.云数据库Greenplum版是基于G

阿里云数据库，破解大型网站架构设计中的数据存储难题

摘要:3月10日,2017阿里云网站行业热点问题和解决方案线下研讨会在上海举行.在本次研讨会上,阿里云数据库团队产品专家王义成(花名挚尤)针对于大型网站的数据库架构设计以及阿里云ApsaraDB所提供的服务管理和解决方案进行了深入介绍. 分享者简介:王义成(花名挚尤),阿里云数据库团队产品专家,负责阿里云NoSQL数据库的产品规划.加入阿里巴巴近5年的时间,参与过多种云数据库的产品设计工作.目前主要负责阿里云的MongoDB.Redis以及MemCache产品,旨在为广大客户提供安全可靠的数据库

一分钟了解阿里云产品：云数据库MongoDB版

一. 概述阿里云产品种类齐全,今天让我们一起来了解下云数据库MongoDB版(AliCloudDB for MongoDB)吧. 什么是云数据库MongoDB版呢?我来给大家说说吧. 云数据库MongoDB版基于飞天分布式系统和高性能存储,提供三节点副本集的高可用架构,容灾切换,故障迁移完全透明化.并提供专业的数据库在线扩容.备份回滚.性能优化等解决方案. 与自建数据库相比, 云数据库MongoDB版有什么优势呢?我们为您提供更优质的服务: 云数据库

猜你喜欢

B2C电子商务网站的优化切入点和关键之处

现在电子商务类的购物平台有很多很多,而且有很大一部分正处在优化的初期阶段,所以也是seo的一块大的市场,如果能够在这个市场当中做好优化,相信对于自己的日后的seo道路是有巨大的帮助的.当然B2C网站也 ...

Dell PowerEdge 2850服务器 Raid5硬盘掉线解决一例

今天有点儿时间,突然想起了刚来公司的时候,服务器的硬件就出现了一次故障,现在写下来给各位朋友们点儿经验分享记得那次是我这个岗位的人员离职走了之后,经理带我到机房熟悉一下环境,顺便把备份磁带更换一下( ...

android网络编程：URL获取数据和图片

首先,开始最简单的网络编程实战,URL实现网络连接,不懂的童鞋可以参考JAVA中的URL编程,其原理是一样的,在这里不再多做解释. 直接贴出实现源代码: public class DataActiv ...

wps表格怎样固定某一行

在wps表格中固定某一行的方法: 首先我们新建一个wps表格,里面填充一些数据. 然后假如你需要固定第一行,那么鼠标点击第一行左侧序号,将第一行全部选中. 之后在"开始"菜单下 ...

Photoshop给水泥路面上的人物加上暗黄色逆光

Photoshop给水泥路面上的人物加上暗黄色逆光.素材图片为阴天拍摄,画面缺少霞光和高光;处理的时候需要给天空部分换上霞光素材;然后把整体大幅压暗;再把主色转为暖色,天空底部区域渲染一些高光即可 ...

win8系统下暴风影音屏幕怎么调整横竖屏

win8系统下暴风影音屏幕怎么调整横竖屏 1.首先,打开自己的电脑,随便打开一个视频; 2.这个视频,看起来很别扭,就因为我们本该竖屏播放的,却是横屏显示的.我们需要点击一 ...

php通过Chianz.com获取IP地址与地区的方法

这篇文章主要介绍了php通过Chianz.com获取IP地址与地区的方法,是解析IP地址与地区非常实用的技巧,需要的朋友可以参考下本文实例讲述了php通过Chianz.com获取IP地址与 ...

PHP使用PDO连接ACCESS数据库

1,参考W3CSHOOL http://www.w3cschool.cc/php/php-pdo.html 2,连接access 代码如下: <?php $db = new PDO(&qu ...

Win7系统快速隐藏硬盘分区技巧

想要隐藏硬盘分区除了可以使用Win7系统自带的Windows EFS.BitLocker之类的加密软件,还可以直接在分区属性中勾选"隐藏",但是这些隐藏加密方法各有利弊. 比如 ...

如何让两台电脑共用一台打印机？

设置共享打印机的电脑: 1:两台机器确定已经连成局域网,在同一个工作组,而且保证可以互访. 2:在连接打印机的电脑上确保正确安装了打印机驱动,而且正常使用. 3:查看网上邻居属性本地连接属性里的 ...

火狐浏览器Flash在win7系统上假死甚至是停止响应如何解决

说到日常主流浏览器,不得不提及Mozilla Firefox浏览器.不知不觉中,这只火狐从最早的Firefox 3.0一直跨入Firefox 30里程碑.由于火狐默认将Flash插件加入自动播放白名单 ...

如何为Win8系统空密码帐户

一般情况下,用户不会在意使用什么系统账户登录系统,如果用获得完全权限的管理员账户登录系统会给系统带来安全隐患.在下面的教程中,小编将教你如何使用net user命令设置空密码账户. 1.在Win8系统 ...

【短视频SDK】如何实现变速录制做一个像抖音、muse这样的短视频应用

之前我们发了一个关于阿里云短视频SDK上线前置变速录制+音乐的博文见:阿里云首推音乐变速短视频SDK,上线抖音 freestyle只需1步.但是具体如何做呢?看起来这么高大上的功能使用SDK集成简单吗 ...

Java数据库程序的这个语句有什么用

问题描述 stmt=conn.createStatement(ResultSet.TYPE_SCROLL_SENSITIVE,ResultSet.CONCUR_UPDATABLE);感觉删掉也没什么影 ...

IOS仿微信朋友圈好友展示

前几天小伙伴要帮他做一个群聊功能,里面有好友列表,要求和微信的差不多(见下图),让小伙伴自己实现了下,他将CollectionView放在tableView的tableHead中,可是当添加好友或删除 ...

安卓-下载服务器的apk文件程序出现异常

问题描述下载服务器的apk文件程序出现异常代码如下: public class AsyncTaskTestActivity extends Activity { @Override protect ...

mybatis-generator-maven管理jar包公服总是下载失败

问题描述 maven管理jar包公服总是下载失败如题 org.mybatismybatis-generator-core1.3.2 我在pom里加了这一段,然后自动下载的jar包总是后缀为.last ...

超过24%！天合光能IBC电池效率再创新高

近日,从天合光能光伏科学与技术国家重点实验室传来喜讯,其自主研发的大面积6英寸全背电极太阳电池(IBC)效率超过24%,达到24.13%,开路电压超过700mV.这一结果经过了日本JET的第三方测试认 ...

多起网络谣言事件被查明相关责任人和网站受处理

新华社北京10月25日电记者近日从国家互联网信息办公室网络新闻宣传局获悉,近期在网络上流传的"国家税务总局关于修订征收个人所得税问题的规定的47号公告"."网传歼-10 ...

link环境下，制作一款《网盘软件》，如果不用“云服务器”，如何实现“弹性计算”的功能？

问题描述 link环境下,制作一款<网盘软件>,如果不用"云服务器",如何实现"弹性计算"的功能? link环境下,制作一款<网盘软件> ...

通州城管用高清监控系统维护城市环境

"有人在万达广场北侧散发小广告,请北苑执法队巡视队员处理."通州城管指挥中心副主任科员张莉盯着大屏幕,通过对讲机与巡逻人员取得联系,4分20秒后,通州城管北苑执法队队员赶到现场, ...

儿童社交网站成新蓝海：网瘾问题令其成烫手山芋

中介交易 SEO诊断淘宝客云主机技术大厅售价120元的摩尔庄园超级拉姆套装售价369元的Webkinz玩偶喜马拉雅猫售价369元的毛绒玩具Webkinz赫斯基 8月底,央视<朝闻天下 ...

怎样将下面的“回访提醒的时间”由另外一个页面的传值而改变

问题描述就是我有两个jsp页面,想用一个页面的时间去改变另外一个有值的时间解决方案解决方案二:是父子窗口的关系吗?父子窗口通过JS可以.要是不相关页面就不行了.

eclipse自动关闭

问题描述在eclipse写代码,老是自动关闭,有log,不知道怎么看,怎么解决,求高手!!!log日志如下:##AfatalerrorhasbeendetectedbytheJavaRuntimeE ...

苹果高效资本运作的幕后：坚持轻资产模式

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅腾讯科技讯(谭燃)北京时间7月25 ...

企业站内部优化的几个特点

一.整站结构优化 1.栏目设置要遵循的原则 A.按需设置.清晰精练 Emmar曾经做过很多的企业站,所以对企业站比较了解,根据我的经验,利于SEO的企业网站栏目,需要根据企业本身的行业特点和目标客户的 ...

如何查看网站在百度中的权生

百度不像gg那样,有个pr可以让我们站长直接了解网站的权重,百度相对来就比较难看出权重了,下面我们根据经验,总结了如何查看网站在百度的权重哦. 第1:网站类型如果你要找友情链接,尽量找跟你网站同类的 ...

1500万个数据，打造个性胸罩！

这是一家用互联网思维打造一款胸罩的公司True&Co.;,它是用大数据的方法挖用户痛点. 我们个微创新学员是国内做女性内衣的大佬,看到True&Co.;的做法,感觉很惊讶.用大数据的方 ...

RoboVM 被 Xamarin 收购，不再开源

自从 RoboVM 被 Xamarin 收购以来,公司不断的提升服务的价格,现在已经关闭了 RoboVM 的源代码. RoboVM 在 10 月 21 日被 Xamarin 收购. Xamarin 和 ...

114啦网址导航站近日宣布开源，对外公开程序及数据

6月22日消息,据可靠渠道消息,114啦网址导航站将于近日宣布开源,对外公开程序及数据. 对于开源的目的,114啦内部的消息人士指出,114啦网址导航程序近年来遭到大量的模仿和抄袭并被到处兜售肆意修改 ...

热搜