Hash函数以及解决冲突的方法

来源:互联网 发布:mac版ico转换器 编辑:程序博客网 时间:2024/05/21 06:25

最常用的3个HASH函数:

1. 除法散列法:通过取k除以m的余数,来将关键字k映射到m个槽的某一个中去,即散列函数为:

     h(k) = k mod m

2. 乘法散列法:首先,用关键字k乘上常数A(0<A<1),并抽取kA的小数部分;然后,用m乘以这个值,再取结果的底(即整数部分)。散列函数可表达为:

     h(k) = ⌊m(kA mod 1)⌋

3.全域散列法(universal hashing)


解决冲突常用的两种方法:

1. 链接法(chaining):把散列到同一槽中的所有元素都存放在一个链表中。每个槽中有一个指针,指向由所有散列到该槽的元素构成的链表的头。如果不存在这样的元素,则指针为空。如果链接法使用的是双向链表,那么删除操作的最坏情况运行时间与插入操作相同,都为O(1),而平均情况下一次成功的查找需要Θ(1+α)时间。α是装填因子。

2. 开放寻址法(openaddressing):所有的元素都存放在散列表中。因此,适用于动态集合大小n不大于散列表大小的情况,即装载因子不超过1。否则,可能发生散列表溢出。有三种技术常用来计算开放寻址法中的探测序列:线性探测、二次探测,以及双重探测。