散列函数的构造方法11.1.2

来源：互联网发布：贵州大数据管理局地址编辑：程序博客网时间：2024/06/05 19:26

一个好的散列函数一般要考虑以下两个因素：

1、计算简便，以便提高转换速度
2、关键词对应的地址空间分布均匀，以尽量减少冲突

散列函数的常用方法

关键词为数字

1、直接定址法

取关键词的某个线性线性函数作为散列地址，即h(key)=axkey+b,比如统计1949年成立以来的司令身份，h(key)=key-1949.

2、除留余数法：

h(key)=key mod p
一般p=tablesize=素数以使对象分布均匀

3、数字分析法

分析关键字的各个位，取比较随机的位来考虑散列地址，比如取手机号的后4位

4、折叠法

把关键词分割成相同的几个部分，然后相加
比如：123456地址取12+34+56

5、平方取中法

把关键词平方后，取中间的几位。

关键词为字符串

算法1、如果是a3、b2、c1就冲突，冲突严重。
算法2、冲突还是比较严重。
算法3、涉及到关键词的每一位、分布均匀。

算法3详细分析和实现：
比如:”abcd”
h(“abcd”)=’a’x32^3+’b’x32^2+’c’x32^1+’d’
我们可以对式子变形以减少乘法次数
((‘a’x32+’b’)x32+c)x32+’d’
并且乘以32可以看成左移5位
((‘a’<<5+’b’)<<5+’c’)<<5+’d’

postion hash(const char key[],int tablesize){unsigned int h=0;  while(*key!='\0')  h=h<<5+*key++;  return h%tablesize;}

阅读全文

0 0