哈希表及其操作

来源:互联网 发布:kali linux不能上网 编辑:程序博客网 时间:2024/06/05 08:43

哈希表

定义:

一般的查找都是基于比较的,其关键字和在结构中的位置是没有确定的对应关系的,查找的效率依赖于比较的次数。
理想的情况是,每个记录的关键字和其在结构中的位置是有确定的关系的,就像是函数的变量和因变量一样,对于每一个K,有一个f(K)与之对应。这样我们在查找时候就可以根据给定的关键字K而直接找到其对应的镜像。此时,我们称这个对应关系f哈希函数,按这个思想建立的表称为哈希表

构造哈希表的步骤:

1. 构造哈希函数:

这一步就是需要构造一个好的哈希函数,这样在存取时能更有效率。好的哈希函数有这样的特点:即对于关键字集合中的任一个关键字,经哈希函数映像到地址集合中任一个地址的概率是相等的。

常见的构造哈希函数的方法:
  1. 直接定址法:取关键字或者关键字的某个线性函数值作为哈希地址。即H(key)=keyH(key)=akey+b其中ab都是常数

  2. 数字分析法:假设关键字是以r为基的数,并且哈希表中可能出现的关键字都是事先知道的,则可以去关键字的若干数位组成哈希地址。

  3. 平方取中法:取关键字平方之后的中间几位为哈希地址。

  4. 折叠法:将关键字分割为位数相同的几部分(最后一部分的位数可以不同),然后取这几部分的叠加和作为哈希地址,

  5. 除留余数法:取关键字被某个不大于哈希表表长m的数p除后所得的余数为哈希地址。即H(key)=keymodp,pm

  6. 随机数法:选择一个随机数,取关键字的随机函数值作为他的哈希地址。即H(key)=random(key)

2. 确定冲突处理方案:
常见的处理冲突的方法:
  1. 开放定址法:Hi=(H(key)+di)modm,i=1,2...k(km1)其中H(key)为哈希函数,m为哈希表的长度,di为增量序列。

    • di=1,2,3,4....m1,称为线性探测再散列
    • di=12,12,22,22,32,...,k2,k2称为二次探测再散列
    • di=,称为为随机探测再散列
  2. 再哈希法:Hi=RHi(key),i=1,2,3,.....,kRHi均是不同的哈希函数,即在同义词产生地址冲突时计算另一个哈希函数地址,知道冲突不在发生。

  3. 链地址法:将所有关键字为同义词的记录存储在同一线性链表中。假设某哈希函数产生的哈希地址在区间[0,m-1]上,则设立一个指针型向量Chain ChainHash[m];其中每个分量的初识状态都是空指针。凡哈希地址为i的都插入到头指针为ChainHash[i]的链表中。

  4. 使用公共溢出区:假设哈希函数的值域为[0,m-1],则设向量HashTable[0…..m-1]为基本表,每个分量存放一个值,另设立向量OverTable[0,…,v]为溢出表。所有关键字和基本表中的关键字为同义词的记录,不管他们由哈希函数得到的哈希地址是什么,一旦发生冲突,都填入溢出表中。

0 0
原创粉丝点击