散列(学习记录)

来源:互联网 发布:ubuntu jdk8 64位下载 编辑:程序博客网 时间:2024/06/16 03:30

开放寻址:
当普通的hash出现碰撞时可以通过对输入的key值添加诱导因子从而使得输入变得不同,导致输出不同,来避免碰撞的产生。因为所有的关键字放在一个散列表中,因而将该诱导因子的值域设置成与散列表的大小相同,能够更充分的利用整个散列。比如说散列表的大小是m,那么诱导因子可以使0、1、2、3.。。。。。。m-1。
通常在开放寻址中所用的散列函数主要由以下几种:

线性试探法:
设 hash(key, i)=(hash’(key)+i) mod m,其中 i=0,1,…,m-1,hash’为辅助散列函数
这种算法简单易用,但问题就是诱导因子i的步幅过于密使得插入或者搜素可能会更加耗时间。

二次试探法:
设 hash(key,i)=(hash’(key)+c1i+c2i2) mod m,如上所述,i=0,1,…,m-1,hash’为辅助散列函数,c1,c2为辅助参数

双重试探法:
设 hash(key,i)=(hash’(key)+i×hash”(key)) mod m,其中i=0,1,…,m-1,hash’,hash”均为辅助散列函数
双重试探法的首个探查位置为hash’(key),当产生碰撞之后,接下来的探查位置为(hash’(key)+hash”(key)) mod m,因此我们发现在双重试探法中,不仅初始探查位置依赖于关键字key,探查序列中的增量hash”(key)同样依赖于关键字key,因而整个散列表提供了m2种不同的探查序列,较之于前两种开放寻址具备了更多的灵活性。这里还要注意的是应保证hash”(key)与m互质,因为根据固定的偏移量所寻址的所有槽将形成一个群,若最大公约数p=gcd(m, hash”(key))>1,那么所能寻址的槽的个数为m/p

原创粉丝点击