[数据结构]-散列表（哈希表）

      在这里没有新的原创性的东西。该部分内容主要取材于《软件设计师教程》部分的内容。
      我想强调一种数据结构，散列表。它是基于快速存取的角度设计的，也是一种典型的“空间换时间”的做法。顾名思义，该数据结构可以理解为一个线性表，但是其中的元素不是紧密排列的，而是可能存在空隙。也就是说，比如我们存储70个元素，但我们可能为这70个元素申请了100个元素的空间。70/100=0.7，这个数字称为负载因子。我们之所以这样做，也是为了“快速存取”的目的。我们基于一种结果尽可能随机平均分布的固定函数H为每个元素安排存储位置，这样就可以避免遍历性质的线性搜索，以达到快速存取。但是由于此随机性，也必然导致一个问题就是冲突。所谓冲突，即两个元素通过散列函数H得到的地址相同，那么这两个元素称为“同义词”。这类似于70个人去一个有100个椅子的饭店吃饭。散列函数的计算结果是一个存储单位地址，每个存储单位称为“桶”。设一个散列表有m个桶，则散列函数的值域应为[0,m-1]。
      解决冲突是一个复杂问题。冲突主要取决于：（1）散列函数，一个好的散列函数的值应尽可能平均分布。（2）处理冲突方法。（3）负载因子的大小。太大不一定就好，而且浪费空间严重，负载因子和散列函数是联动的。
      解决冲突的办法：
     （1）线性探查法：冲突后，线性向前试探，找到最近的一个空位置。缺点是会出现堆积现象。存取时，可能不是同义词的词也位于探查序列，影响效率。
     （2）双散列函数法：在位置d冲突后，再次使用另一个散列函数产生一个与散列表桶容量m互质的数c，依次试探(d+n*c)%m，使探查序列跳跃式分布。

      下面例子，为c语言一共32个关键字建立散列表，为简单每个桶的容量为1，取负载因子=0.7，因此散列表大小32/0.7=47。双散列函数解决冲突，补偿函数H2的基数取和47互质的数为43。
       主要散列函数H1，取每三个字母为一段，每个字母占据一个字节，折叠累加，取余算法。H2取每两个字母为一段叠加。


Code
#define P1 47
#define P2 43
/* Compute Hash */
int GetHashCode(char *key,int iSection,int iBase, int offset)
{
    long k=0,d;
    int c;
    while(*key)
    {
        for(d=0,c=0; *key != '\0' && c < iSection; c++)
        {
            d=(d<<8)+(*key++);
        }
        k+=d;
    }
    return (k % iBase + offset);
}

/* Double Hash Function */
int H1(char *key)
{
return GetHashCode(key, 3, P1, 0);
}
int H2(char *key)
{
return GetHashCode(key, 2, P2, 1);
}

32个关键字，注意，volatile可能是使用不多的一个关键字，指示变量是易变的，禁止编译器对取值进行优化。

Code
char tbl[N][LEN];
char *kWord[]=
    {
        "auto",        "break",        "case",        "char",        "const",
        "continue",    "default",    "do",            "double",    "else",
        "enum",        "extern",    "float",        "for",        "goto",
        "if",            "int",        "long",        "register",    "return",
        "short",        "signed",    "sizeof",   "static",    "struct",
        "switch",    "typedef",    "union",        "unsigned",    "void",
        "volatile",    "while"
    };

对散列表进行存储的操作代码。查找代码是类似的。用count数组记录每个位置的冲突次数。

Code
for(i=0;i< sizeof(kWord)/sizeof(kWord[0]); i++)
    {
        pos= H1(kWord[i]);
        c  = H2(kWord[i]);
        while(tbl[pos][0]!='\0' && strcmp(tbl[pos],kWord[i]))
        {
            count[pos]++;
            pos=(pos+c)%N;
            printf(",%d",pos);
        }
        strcpy(tbl[pos],kWord[i]);
    }

------------------------------------------------------------
存储时，每个元素的探查序列如下（数字为数组元素索引值）：
auto      : 12
break     : 11
case      : 40
char      : 41
const     : 33
continue : 45
default   : 37
do        : 2
double    : 15
else      : 25
enum      : 30
extern    : 34
float     : 23
for       : 4
goto      : 41,37,33,29
if        : 4,26
int       : 39
long      : 23,13
register : 28
return    : 16
short     : 13,25,37,2,14
signed    : 25,0
sizeof    : 0,43
static    : 18
struct    : 38
switch    : 15,18,21
typedef   : 26,7
union     : 6
unsigned : 11,38,18,45,25,5
void      : 7,31
volatile : 33,17
while     : 32

可见，最长的探查序列为6次。
-----------------------------------------------------
各元素在散列表中的分布如下：
0: signed      2: do          4: for         5: unsigned    6: union
7: typedef    11: break      12: auto       13: long       14: short
15: double     16: return     17: volatile   18: static     21: switch
23: float      25: else       26: if         28: register   29: goto
30: enum       31: void       32: while      33: const      34: extern
37: default    38: struct     39: int        40: case       41: char
43: sizeof     45: continue

存在冲突的位置的冲突计数如下：
count[ 0]=1    count[ 2]=1    count[ 4]=1    count[ 7]=1    count[11]=1
count[13]=1    count[15]=1    count[18]=2    count[23]=1    count[25]=3
count[26]=1    count[33]=2    count[37]=2    count[38]=1    count[41]=1
count[45]=1

时间： 2024-09-30 08:55:36

[数据结构]-散列表（哈希表）的相关文章

[数据结构与算法]哈希表（等概率情况下）查找成功与查找不成功的平均查找长度

做到一道求哈希表查找成功与查找不成功情况下平均查找长度的计算问题,迷惑了好一会,在这里总结下来: 首先,你要明白的是平均查找长度求的是期望,那么你就按照求期望的方法来求平均查找长度吧,千万记着期望怎么求平均查找长度就怎么求啊. 题目: 在地址空间为0~16的散列区中,对以下关键字序列构造两个哈希表: {Jan, Feb, Mar, Apr, May, June, July, Aug, Sep, Oct, Nov, Dec} (1) 用线性探测开放地址法处理冲突: (2) 用链地址法

并发数据结构-1.6 哈希表

原文链接,译文链接,译者:iDestiny,校对:周可人典型可扩展的哈希表即一个可调整大小的桶数组(buckets), 每一个桶存放预期数量的元素,因此哈希表平均在常量时间内进行插入,删除,查询操作.哈希表调整大小的主要成本-–在于新旧桶(buckets)之间进行重新分配操作,该操作被分摊到所有表操作上,所以平均操作时间也是常量的.哈希表调整大小就是扩容,在实践中,哈希表仅需要增加数组大小即可. Michael实现了一个可并发,不可扩展的哈希表(通过对哈希表中每个桶进行读写锁约束).然而,为了

AS2.0中实现数据结构-哈希表

数据|数据结构在游戏制作中我们经常需要存储一些离散的对象数据,比如道具箱里的道具,经常需要执行插入和删除操作,而且道具之间没有联系是无序排列的.有些人会说直接用数组不就得了,但是有大量数据存储时的数组的删除插入操作的效率是很低的.因此我们需要哈希表这样的可以提供快速的插入和删除,查找操作的数据结构,不论哈希表中有多少数据,插入和删除操作只需要接近常量的时间:即O(1)的时间级.既然这么好那么我们的AS可以实现吗?当然可以!AS发展到AS2.0,已经成为在语法上更接近于Java + Pascal

java HashSet类实现哈希表

/*HashSet 类实现哈希表(散列表) 我们应该为插入到哈希表的各个对象重写 hashCode()和equals() 方法 String 类重写的 hashCode() 是根据字符串计算的 Object 类的 hashCode() 是根据内存地址计算散列地址哈希表只能通过迭代器迭代元素 Iterator */ import java.util.*; class HashTest { public static void main(String []args)

浅谈算法和数据结构十一哈希表

在前面的系列文章中,依次介绍了基于无序列表的顺序查找,基于有序数组的二分查找,平衡查找树,以及红黑树,下图是他们在平均以及最差情况下的时间复杂度: 可以看到在时间复杂度上,红黑树在平均情况下插入,查找以及删除上都达到了lgN的时间复杂度. 那么有没有查找效率更高的数据结构呢,答案就是本文接下来要介绍了散列表,也叫哈希表(Hash Table) 什么是哈希表哈希表就是一种以键-值(key-indexed) 存储数据的结构,我们只要输入待查找的值即key,即可查找到其对应的值. 哈希的思路很简单

数据结构是哈希表（hashTable）

哈希表也称为散列表,是根据关键字值(key value)而直接进行访问的数据结构.也就是说,它通过把关键字值映射到一个位置来访问记录,以加快查找的速度.这个映射函数称为哈希函数(也称为散列函数),映射过程称为哈希化,存放记录的数组叫做散列表.比如我们可以用下面的方法将关键字映射成数组的下标:arrayIndex = hugeNumber % arraySize. 哈希化之后难免会产生一个问题,那就是对不同的关键字,可能得到同一个散列地址,即同一个数组下标,这种现象称为冲突,那么我

数据结构与算法07 之哈希表

C#与数据结构--哈希表（Hashtable）

C#中实现了哈希表数据结构的集合类有: (1)System.Collections.Hashtable (2)System.Collections.Generic.Dictionary<TKey,TValue> 前者为一般类型的哈希表,后者是泛型版本的哈希表.Dictionary和Hashtable之间并非只是简单的泛型和非泛型的区别,两者使用了完全不同的哈希冲突解决办法.Dictionary我已经做了动态演示程序,使用的是Window应用程序.虽然Dictionary相对于Hashtable

数据结构哈希表有关问题求助

问题描述数据结构哈希表有关问题求助一直搞不懂哈希表等我问题,还有线性探测再散列和二次探测再散列,请举例子帮我详细讲解一下,谢谢了解决方案 [数据结构]哈希表数据结构-哈希表数据结构之哈希表

猜你喜欢

哲学家就餐问题的C#实现

问题撰文:周翔这是我在上操作系统课的那个学期写的一段程序,并组织成了一篇文章.当初被我的挚友曾毅发表在CSTC的论坛上:http://cstc.net.cn/bbs/viewtopic.php?t ...

如何获取Windows系统登陆用户名

一般用 GetUserName(或 GetUserNameEx )函数可得到当前登陆登陆用户名(但不总会得到,下面会分析),此系统函数在Win95.WinNT 及以后所有操作系统中都可用.代码如下: ...

图形超链接类

前言: 我在写程序的过程中发现著名的CHyperLink类不能用于图形控件的超链接,于是在其基础上修改了一下, 为了方便用户的使用,并没有与CHyperLink类整和,而是另立了一个类,叫CMapHy ...

电脑显卡型号怎么看

电脑显卡型号怎么看要了解电脑的显卡性能,首先要知道显卡的型号以及相关参数. 获取电脑显卡型号与参数有N种方法,这里简单介绍几种常用的方法. 1.右键点"计算机"图标,左键点& ...

不需要远程传输文件Linux如何关闭scp和sftp命令

Linux用户们在进行远程文件的传输时,经常会使用scp和sftp命令来进行.不过这两个命令也会让我们的电脑存在一些风险,因此在不需要远程传输文件的时候,我们就可以将它们关闭.那么该如何禁止scp ...

word2007在文档中发现点和箭头

表现在文档中,您发现应为空格的位置变成了点,应为制表符的位置变成了箭头,还发现其他不想要的字符. 图1 原因当您在 Word 中显示格式标记时这些符号即为可见. 解决方案隐藏格式标记. 在& ...

Win7通过注册表打开立体声混音选项

1. 点 "开始"->"运行" 输入 "REGEDIT" 运行注册表编辑器. 2. 在注册表编辑器出现后, 找到以下路径HKEY_ ...

三大技巧轻松识别U盘好坏

一.从外形入手 1.看U盘的材质(塑料的). 原装U盘的材质颜色比较均匀,无杂质;高仿的有杂质,颜色不均匀,有的还有小黑点. 2.看U盘侧面的标识. 标识上面标有容量.型号.序号.虽然高仿U盘的也 ...

小编教您怎样激活Windows7管理员权限

Win7系统中的一些文件在修改时需要管理员权限,但是Win7系统默认管理员账户是关闭的,那么该如何开启Win7管理员账户呢?现在小编就教大家开启管理员账户的方法. 开启管理员账户的方法: 获得超级管理 ...

win8系统下IE浏览器使用VPN的方法

在国内一般情况下使用普通的网络连接就足以满足上网需求,但偶尔需要使用VPN.其实设置VPN并不难,通过IE也能进行设置,下面我们来看看操作方法. 操作步骤 1.点击IE设置按钮,选择Internet选 ...

如何解决电脑宽带连接反复拨号不能成功的问题

解决办法: 第一步.首先看看是不是因电压不稳导致Modem工作不稳定,当出现此问题时先重启Modem,再重启系统试试; 第二步.检查网卡到Modem线路,接口是否松动;最后有可能的地方就是网络协议 ...

还在纠结该从哪门编程语言学起？先来聊聊JavaScript

大多数人学习编程的旅程都是从深夜的一次度娘搜索开始的. 比如很多情况下会是搜索:"学习__(某种编程语言)" 但是他们是如何决定他们想要学习的语言种类的呢? 有些人这么想,&quo ...

游戏-关于Unity5的Ambient Source问题

问题描述关于Unity5的Ambient Source问题 2C 请问各位Unity大侠,为什么在游戏运行的时候Environment Lighting中的Ambient Source设置为Grad ...

edittext-Android EditText中定位光标位置的问题

问题描述 Android EditText中定位光标位置的问题 @Override public boolean onTouchEvent(MotionEvent event) { switch (e ...

在 VMware Workstation 中安装 JUNOS Olive 12.2R2.4

xsd验证xml的有效性出现类型无效的问题

问题描述这是我的xsd:<?xmlversion="1.0"encoding="utf-8"?><xsd:schemaattributeFo ...

进程间通讯-Android开发 AIDL接口文件里使用内部类报错unknown type

问题描述 Android开发 AIDL接口文件里使用内部类报错unknown type 在Android开发时涉及到一个进程间通讯,要传递一个内部类对象到远程服务端.已经把内部类对象用Parcelab ...

利用LoadRunner编写socket性能测试脚本

一.概述 Loadrunner拥有极为丰富的工具箱,供予我们制造出各种奇妙魔法的能力.其中就有此次要讨论的socket套接字操作. 二.socket概述 socket是操作系统中I/O系统的网络延伸部 ...

Javascript字符串常用方法详解

字符串字符串就是一个或多个排列在一起的字符,放在单引号或双引号之中. 'abc' "abc" length 属性 js里的字符串类似于数组,都是一个一个字符拼凑在一起组成的,因此 ...

shiro spring struts-shiro自定义authc过滤器的问题

问题描述 shiro自定义authc过滤器的问题配置了过滤器代码如下public class FormAuthenticationCaptchaFilter extends FormAuthent ...

《HTML5+CSS3网页设计入门必读》——6.3 调整字体

6.3 调整字体有时,你可能想对文本的大小和外观进行更多一点控制,而不仅仅是将其设置为粗体或斜体.在我深入讨论使用CSS调整字体的合适方式之前,让我们简要探讨在CSS出现之前是怎样操作的:当你查看其 ...

打开Excel 2007很慢怎么,Excel 2007很慢原因分析

打开Excel选项进行设置 1.打开excel--点击左上角的图标找到--excel选项: 2.打开后找到校对,将自动更正里面的对勾都取消: 3.打开保存选项--将自动保存打上勾, ...

程序员遇到Bug后的30种常见反应

开发应用程序是件压力很大的事情,尤其是当编写完代码后,突然冒出个Bug,这真是让人百感交集.痛不欲生.那么,如何平心静气地解决每一个Bug,是每个程序员都要修炼的地方. 下面本文将分享程序员遇到Bug ...

js静态方法与实例方法分析_javascript技巧

js静态方法复制代码代码如下: function foo(){} // 声明类 foo.method = function(){} // 方法体使用:foo.method() js实例方法 fu ...

10034 - Freckles 克鲁斯克尔最小生成树！～

/* 10034 - Freckles 克鲁斯克尔最小生成树!- */ #include<iostream> #include<cstdio> #include<cmat ...

给大家提供一个“开发工具” 各种管理系统通吃节省5分之1开发时间

问题描述平台简介基于微软.NET开发平台架构,使用C/S和B/S混合结构,全部系统设计均依据SOA的核心理念,将所有应用功能分解为组件(服务.模块.解释器.支持.模板等),主引导程序基于自动发现加载 ...

为什么我Asp.net中没有microsoft.jet呢？我用的是VS2008的请问如何解决!

问题描述我的VS2008中就只有这几个缺没有JET为什么??Microsoft.CSharp;Microsoft.SqlServer;Microsoft.VisualBasic;Microsoft. ...

c++-关于C8051F340 USB 通讯上位机的问题？

问题描述关于C8051F340 USB 通讯上位机的问题? 大家好, 我在学习使用上位机通过USB 传输12个十六进制的数字到C8051F340,然后我发现http://blog.csdn.net/ ...

spring+hibernate 配置文件出错

问题描述 hibernate.cfg.xml<?xmlversion="1.0"encoding="UTF-8"?><!DOCTYPEhibe ...

数据结构实践——括号的匹配(栈)

本文是针对数据结构基础系列网络课程(3):栈和队列的实践项目. [项目 - 括号的匹配] 假设表达式中允许三种括号:圆括号.方括号和大括号.编写一个算法,判断表达式中的各种左括号是否与右括号匹配. 例 ...

热搜