memcached（八）一致性哈希高级应用

简介

一致性哈希算法在1997年由麻省理工学院提出(参见扩展阅读[1])，设计目标是为了解决因特网中的热点(Hot spot)问题，初衷和CARP十分类似。一致性哈希修正了CARP使用的简单哈希算法带来的问题，使得DHT可以在P2P环境中真正得到应用。

英文解释

Consistent hashing is a scheme that provides hash table functionality in a way that the addition or removal of one slot does not significantly change the mapping of keys to slots.

哈希算法

一致性哈希提出了在动态变化的Cache环境中，哈希算法应该满足的4个适应条件：

平衡性(Balance)

平衡性是指哈希的结果能够尽可能分布到所有的缓冲中去，这样可以使得所有的缓冲空间都得到利用。很多哈希算法都能够满足这一条件。

单调性(Monotonicity)

单调性是指如果已经有一些内容通过哈希分派到了相应的缓冲中，又有新的缓冲区加入到系统中，那么哈希的结果应能够保证原有已分配的内容可以被映射到新的缓冲区中去，而不会被映射到旧的缓冲集合中的其他缓冲区。（这段翻译信息有负面价值的，当缓冲区大小变化时Consistent hashing尽量保护已分配的内容不会被重新映射到新缓冲区。）

简单的哈希算法往往不能满足单调性的要求，如最简单的线性哈希：

x → ax + b mod (P)

在上式中，P表示全部缓冲的大小。不难看出，当缓冲大小发生变化时(从P1到P2)，原来所有的哈希结果均会发生变化，从而不满足单调性的要求。

哈希结果的变化意味着当缓冲空间发生变化时，所有的映射关系需要在系统内全部更新。而在P2P系统内，缓冲的变化等价于Peer加入或退出系统，这一情况在P2P系统中会频繁发生，因此会带来极大计算和传输负荷。单调性就是要求哈希算法能够应对这种情况。

分散性(Spread)

在分布式环境中，终端有可能看不到所有的缓冲，而是只能看到其中的一部分。当终端希望通过哈希过程将内容映射到缓冲上时，由于不同终端所见的缓冲范围有可能不同，从而导致哈希的结果不一致，最终的结果是相同的内容被不同的终端映射到不同的缓冲区中。这种情况显然是应该避免的，因为它导致相同内容被存储到不同缓冲中去，降低了系统存储的效率。分散性的定义就是上述情况发生的严重程度。好的哈希算法应能够尽量避免不一致的情况发生，也就是尽量降低分散性。

负载(Load)

负载问题实际上是从另一个角度看待分散性问题。既然不同的终端可能将相同的内容映射到不同的缓冲区中，那么对于一个特定的缓冲区而言，也可能被不同的用户映射为不同的内容。与分散性一样，这种情况也是应当避免的，因此好的哈希算法应能够尽量降低缓冲的负荷。

结论

一致性哈希基本解决了在P2P环境中最为关键的问题——如何在动态的网络拓扑中分布存储和路由。每个节点仅需维护少量相邻节点的信息，并且在节点加入/退出系统时，仅有相关的少量节点参与到拓扑的维护中。所有这一切使得一致性哈希成为第一个实用的DHT算法。

但是一致性哈希的路由算法尚有不足之处。在查询过程中，查询消息要经过O(N)步(O(N)表示与N成正比关系，N代表系统内的节点总数)才能到达被查询的节点。不难想象，当系统规模非常大时，节点数量可能超过百万，这样的查询效率显然难以满足使用的需要。换个角度来看，即使用户能够忍受漫长的时延，查询过程中产生的大量消息也会给网络带来不必要的负荷。

memcache的客户端分布式

memcached的客户端分布式采用了一致性哈希算法，流程如下：

查看本栏目更多精彩内容：http://www.bianceng.cnhttp://www.bianceng.cn/webkf/tools/

时间： 2024-10-31 14:15:46

memcached（八）一致性哈希高级应用的相关文章

memcached分布测试（一致性哈希情况下的散列函数选择）

memcached本身是集中式的缓存系统,要搞多节点分布,只能通过客户端实现.memcached的分布算法一般有两种选择: 1.根据hash(key)的结果,模连接数的余数决定存储到哪个节点,也就是hash(key)% sessions.size(),这个算法简单快速,表现良好.然而这个算法有个缺点,就是在memcached节点增加或者删除的时候,原有的缓存数据将大规模失效,命中率大受影响,如果节点数多,缓存数据多,重建缓存的代价太高,因此有了第二个算法. 2.Consistent Has

一致性哈希算法的应用及实现

一致性哈希算法(Consistent Hashing Algorithm)是一种分布式算法, 由MIT的Karger及其合作者提出,现在这一思想已经扩展到其它领域. 1997年发表的学术论文中介绍了"一致性哈希"如何应用于用户易变的分布式Web服务中. 一致性哈希可用于实现健壮缓存来减少大型Web应用中系统部分失效带来的负面影响.(维基百科) hash算法的单调性 Hash 算法的一个衡量指标是单调性( Monotonicity ),定义如下: 单调性是指如果已经有一些内容通过哈希分派

memcached（九）客户端高级-Java

简介目前常用的Java客户端有3种. MemcachedClient spymemcached xmemcached MemcachedClient:其中笔者亲测,在高并发的时候,容易报异常,Out Of Memory. spy:的性能比xmemcached略差. xmemcached:虽然是国产,但是首选,性能和稳定性超强. xmemcached 代码解析设置连接池和权重 Java代码 MemcachedClientBuilder builder = new XMemcache

一致性哈希算法以及其PHP实现详细解析_php技巧

在做服务器负载均衡时候可供选择的负载均衡的算法有很多,包括: 轮循算法(Round Robin).哈希算法(HASH).最少连接算法(Least Connection).响应速度算法(Response Time).加权法(Weighted )等.其中哈希算法是最为常用的算法. 典型的应用场景是: 有N台服务器提供缓存服务,需要对服务器进行负载均衡,将请求平均分发到每台服务器上,每台机器负责1/N的服务. 常用的算法是对hash结果取余数 (hash() mod N):对机器编号从0到N-1,按

一致性哈希算法

tencent2012 笔试题附加题问题描述: 例如手机朋友网有 n 个服务器,为了方便用户的访问会在服务器上缓存数据,因此用户每次访问的时候最好能保持同一台服务器.已有的做法是根据 ServerIPIndex[QQNUM%n]得到请求的服务器,这种方法很方便将用户分到不同的服务器上去.但是如果一台服务器死掉了,那么 n 就变为了 n-1,那么ServerIPIndex[QQNUM%n]与 ServerIPIndex[QQNUM%(n-1)]基本上都不一样了,所以大多数用户的请求都会转到其他服务

一致性哈希算法的Java实现

一致性哈希算法是分布式系统中常用的算法.比如,一个分布式的存储系统,要将数据存储到具体的节点上,如果采用普通的hash方法,将数据映射到具体的节点上,如key%N,key是数据的key,N是机器节点数,如果有一个机器加入或退出这个集群,则所有的数据映射都无效了,如果是持久化存储则要做数据迁移,如果是分布式缓存,则其他缓存就失效了. 因此,引入了一致性哈希算法: 把数据用hash函数(如MD5),映射到一个很大的空间里,如图所示.数据的存储时,先得到一个hash值,对应到这个环中的每个位置,如k1

一致性哈希算法 Consistent Hashing 探讨以及相应的新问题出现解决

一.业务场景假如我们现在有12台Redis服务器(其它的什么东西也行),有很多User(用户)的数据数据从前端过来,然后往12台redis服务器上存储,在存储中就会出现一个问题,12台服务器,有可能其中几台Redis服务器上(简称集群A)存了很多的数据,然后另外几台Redis服务器(简称集群B)上存的数据很少,这样的话那 A 上的读写压力就会很大(当然,这个要看你的数据量的大小了,如果你数据量很小的话,基本无压力了,但是数据量很大,那就 ...),对于这样的问题,我们通常的解决办法是什么呢 ?

【转载】五分钟理解一致性哈希算法(consistent hashing)

转载自:http://blog.csdn.net/cywosp/article/details/23397179 简介: 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似.一致性哈希修正了CARP使用的简单哈希算法带来的问题,使得分布式哈希(DHT)可以在P2P环境中真正得到应用. 一致性hash算法提出了在动态变化的Cache环境中,判定哈希算法好坏的四个定义

一致性哈希在分布式数据库中的应用探索

本文大部分内容参考自http://blog.csdn.net/cywosp/article/details/23397179 背景在分布式数据库中,设计数据分布算法通常需要考虑到几点平衡性(Balance)平衡性是指哈希的结果能够尽可能分布到所有的分片节点中去,这样可以使得所有的分片节点都得到利用. 很多哈希算法都能够满足这一条件. 单调性(Monotonicity)单调性是指如果已经有一些内容通过哈希分派到了相应的分片节点中,又有新的分片节点加入到系统中. 哈希的结果应能够保证原有已分配的

猜你喜欢

mysql输错了怎么返回上一行

问题描述 mysql输错了怎么返回上一行 windows下,按回车后就到下一行了,光标怎么弄都回不了上一行了,怎么回呀示例如下... mysql> create table student d ...

Win2003服务器组网、安全管理全攻略三

步骤2.使用Internet 信息服务(IIS)管理器建立一个安全的FTP空间: 现在我们打开"开始菜单"→"程序"→"管理工具"→&quo ...

Access应用：仔细地选择索引

仔细地选择索引 Access根据数据类型,使用了一个索引来依照合理的顺序分类数据.正确的索引能够提高其性能,而错误的索引则会降低效率.到目前为止,最常见的错误就是设置过多的索引.因为Access会在你 ...

解决SQL SERVER 2005无法远程连接的问题

server|解决|问题问题使用SQL Server Management Studio无法连接远程服务器,提示以下错误: 使用telnet 连接1433端口,报告连接失败,应该是网管封了1433 ...

分析阿里巴巴国际站的SEO

趁着今天是星期天,就抽空写一篇分析阿里巴巴国际站SEO的文章,此文章只在A5发布,而且是首发,连我博客上都没发布,因为我是在A5的编辑器里写着,好了,咱不扯开话题,进入正文. 1.阿里巴巴LOGO的处 ...

dos基础知识

什么是Dos Dos的内部命令和外部命令常用的Dos命令(一) 常用的Dos命令(二) 常用的Dos命令(三) 常用的Dos命令(四) 常用的Dos命令(五) 更多的Dos命令如何进入纯DOS系统 ...

可爱的Python:自然语言工具包入门

在本期文章中,David 向您介绍了自然语言工具包(Natural Language Toolkit),它是一个将学术语言技术应用于文本数据集的 Python 库.称为"文本处理" ...

Java Applet入门之数据类型

Java语言有着与C语言类似的教强的数据处理能力,即它的数据类型和不同类型上的运算定义得较为齐全,Java内部的数据类型可以分为四大类:整数.浮点数.字符.布尔型.其中整数和浮点数两大类根据长度和精度 ...

Visual C#构建网络计算机树形图

Visual C#编写网络应用程序一般会使用到.Net FrameWork SDK中提供的二个重要的网络命名空间"System.Net"和"System.Net.Sock ...

驱动人生，让你的电脑始终处于最佳状态

驱动备份: 驱动备份是驱动人生除了驱动更新外,对驱动管理的另一个主导功能.在更新驱动安装完成之后,驱动人生很人性化的提醒用户,在您的电脑中有一个驱动程序需要备份. 驱动人生驱动备份界面驱动人生为我们 ...

常见打印机连接方式和线缆介绍

打印机是每个公司都不可或缺的办公设备,有些家庭中用户也会购买打印机使用,但是买了打印机之后该怎么连接呢?打印机接口也就是指打印机与计算机之间采用的接口类型,目前市场上打印机产品的主要接口类型包括常见的 ...

汇总Win7旗舰版系统中启动服务界面的技巧

windows系统服务管理是包含了计算机操作系统和应用程序提供的所有服务,而众多的系统服务并非都是用户所需要的,因此很多用户习惯通过禁用那些没有别要的服务实现开机加速与优化系统性能.因此小编为大家整合 ...

大神帮帮忙-递归一个文件夹下的所有文件以及文件夹，造成内存溢出问题

问题描述递归一个文件夹下的所有文件以及文件夹,造成内存溢出问题我需要递归一个文件夹下所有的文件并进行操纵,文件夹下也有文件夹,我用一个list存储递归得到的所有文件可能会造成溢出.我需要当此lis ...

c语言-数组指针指向数组的问题

问题描述数组指针指向数组的问题 int main() { char a[5]={'A','B','C','D'}; char (*p3)[10] = &a; char (*p4)[10] = ...

java-JAVA：tamcat启动时异常！！！！！

问题描述 JAVA:tamcat启动时异常!!!!! 我在启动tamcat时输入startup后窗口一闪而过.下面是我的启动过程:最后出现的那个异常说是未捕捉到什么? D:tomcat5.5.17 ...

正确选择网站关键字的方法

摘要: 想很多seo都应该遇到过这样的问题,那就是:怎么确定网站关键字.这些问题对于一个老资格的站长来说好像老鹰吃小鸡一样容易,但对于一个新手来说却不怎么容易,因为都明白一个想很多seo都应该遇到过 ...

联发科换股并购雷凌

本报讯 (记者古晓宇) 记者昨天了解到,台湾芯片厂商联发科将以换股的方式并购同行业公司雷凌科技,联发科也希望凭借此次并购补足自身在个人电脑和平板电脑领域的短板. 联发科与雷凌商定的换股比例为3.15 ...

java购物车问题-java关于商城购物车（cookie基于实现）的一个问题

问题描述 java关于商城购物车(cookie基于实现)的一个问题当设计购物车不登录可以操作,当提交订单是进行登录并且将购物车订单提交. 这种模式有什么不好的地方? 解决方案最终它都得去注册一个号 ...

java web-学习springmvc运行tomcat启动后报错

问题描述学习springmvc运行tomcat启动后报错初学springmvc 自己练习一下最简单的实力但是报错下面是错误代码 type Exception report message de ...

5 AI Trends We Can Expect to See in 2017 and Beyond

Artificial Intelligence (AI) continues to make big strides as a changemaker across various industrie ...

iis7编辑器正常显示输入，无法保存发布

问题描述 iis7编辑器正常显示输入,无法保存发布本地没有问题,发布到服务器后就出现编辑器正常可以显示.编辑. 但拷贝的内容无法发布成功,输入简单的数字.汉字发布可以保存成功...什么原因呀 ...

深入理解Spark：核心思想与源码分析. 1.4　Spark源码编译与调试

1.4 Spark源码编译与调试 1.下载Spark源码首先,访问Spark官网http://spark.apache.org/,如图1-18所示. 图1-18 Spark官网单击Downlo ...

Java-类库-Guava-EventBus

EventBus是Guava的事件处理机制,是设计模式中的观察者模式(生产/消费者编程模型)的优雅实现.对于事件监听和发布订阅模式,EventBus是一个非常优雅和简单解决方案,我们不用创建复杂的类和 ...

摊上事了! Facebook向用户手机发生日信息涉嫌违法

据<财富>网站(Fortune)报道,Facebook近日遭遇一起用户集体诉讼案,或将面临巨额赔偿. 美国佛罗里达州一名叫科林·布里克曼(Colin Brickman)的男子发起了这起对F ...

学习C#数百个命名空间的几千个类还有方法如何记忆？

问题描述大家谈谈学习C#时这么多的属性方法是如何记忆的?要是记忆相同数量的英语单词,英语口语绝对没问题了.真的需要一个一个记忆吗? 解决方案解决方案二:1)熟练:2)常规/习惯,必须Visible ...

互联网垂直&社区时代拉开序幕

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅每天晚上当老婆抢到电脑的时候,她很 ...

[译] AI 能解决你的 UX 设计问题吗？

本文讲的是[译] AI 能解决你的 UX 设计问题吗?, 原文地址:Can AI Solve Your UX Design Problems? 原文作者:Mukund Krishna 译文出自:掘金翻 ...

苹果WWDC发布全新桌面系统Mac OS X Yosemide

[TechWeb报道]北京时间6月3日凌晨1点,苹果公司于美国旧金山Moscone West召开全球开发者大会(WWDC).首先与大家见面的是苹果桌面系统Mac OS X.新版命名为Mac OS X ...

《Unity 5.x游戏开发实战》一1.10　添加一个用来采集的金币

1.10 添加一个用来采集的金币至此,该游戏已经有了很多功能,例如一个完整的环境.一个第一人称视角控制器.一片大海.不过,本章设计的是一个金币采集游戏,但是现在这个游戏场景中还没有任何可以采集的金币 ...

winserver2003中response失败

问题描述最近在做一个网站,通过ajax调用,在response.getwriter().println()的方式,向前端写入内容.我电脑上,浏览器不能收到或不正常.在IE浏览器中,没有收到.在FF中 ...

热搜