散列函数的构造方法11.1.2

来源:互联网 发布:贵州大数据管理局地址 编辑:程序博客网 时间:2024/06/05 19:26

一个好的散列函数一般要考虑以下两个因素:

1、计算简便,以便提高转换速度
2、关键词对应的地址空间分布均匀,以尽量减少冲突

散列函数的常用方法

关键词为数字

1、直接定址法

取关键词的某个线性线性函数作为散列地址,即h(key)=axkey+b,比如统计1949年成立以来的司令身份,h(key)=key-1949.

2、除留余数法:

h(key)=key mod p
一般p=tablesize=素数 以使对象分布均匀

3、数字分析法

分析关键字的各个位,取比较随机的位来考虑散列地址,比如取手机号的后4位

4、折叠法

把关键词分割成相同的几个部分,然后相加
比如:123456地址取12+34+56

5、平方取中法

把关键词平方后,取中间的几位。

关键词为字符串
关键词为字符串
算法1、如果是a3、b2、c1就冲突,冲突严重。
算法2、冲突还是比较严重。
算法3、涉及到关键词的每一位、分布均匀。

算法3详细分析和实现:
比如:”abcd”
h(“abcd”)=’a’x32^3+’b’x32^2+’c’x32^1+’d’
我们可以对式子变形以减少乘法次数
((‘a’x32+’b’)x32+c)x32+’d’
并且乘以32可以看成左移5位
((‘a’<<5+’b’)<<5+’c’)<<5+’d’

postion hash(const char key[],int tablesize){unsigned int h=0;  while(*key!='\0')  h=h<<5+*key++;  return h%tablesize;}
原创粉丝点击