构造散列函数的方法

来源:互联网 发布:mysql添加字段 编辑:程序博客网 时间:2024/06/06 03:31

    今天做题时看到这样的内容因此查查相关的资料了解一下。好的散列函数要求:(1)花费时间段,计算简单。(2)计算的散列地址分布均匀,提高地址的利用率。


1. 直接定址法


    取关键字或关键字的某个线性函数值为散列地址。即H(key)=key或H(key) = a·key + b,其中a和b为常数(这种散列函数叫做自身函数)。


2. 数字分析法

    假设某公司的员工登记表以员工的手机号作为关键字。手机号一共11位。前3位是接入号,对应不同运营商的子品牌;中间4位表示归属地;最后4位是用户号。不同手机号前7位相同的可能性很大,所以可以选择后4位作为散列地址,或者对后4位反转(1234 -> 4321)、循环右移(1234 -> 4123)、循环左移等等之后作为散列地址。


    此方法适合处理关键字位数比较大的情况(如果知道关键字的分布、并且均匀分布的话)


3. 平方取中法



    假设关键字是1234、平方之后是1522756、再抽取中间3位227,用作散列地址。平方取中法比较适合于不知道关键字的分布,而位数又不是很大的情况。当位数很大的情况下此方法不再合适。应当选择下面的折叠法。


4. 折叠法


    将关键字从左到右分割成位数相等的几部分,最后一部分位数不够时可以短些,然后将这几部分叠加求和,并按散列表表长,取后几位作为散列地址。


   例如:关键字是0~9,散列表表长是3位,将其分为四组,然后叠加求和:0 + 321 + 654 +987 = 1962,取后3位962作为散列地址。(

折叠法事先不需要知道关键字的分布,适合关键字位数较多的情况。


5. 除留余数法


    f(key) = key mod p (p≤m),m为散列表长。这种方法不仅可以对关键字直接取模,也可在折叠、平方取中后再取模。根据经验,若散列表表长为m,通常p为小于或等于表长(最好接近m)的最小质数,可以更好的减小冲突。(最常用的构造散列函数方法)



6. 随机数法



     f(key) = random(key),这里random是随机函数。当关键字的长度不等时,采用这个方法构造散列函数是比较合适的。

   选取散列函数的参考:(1)计算散列地址所需的时间;(2)关键字长度;(3)散列表大小;(4)关键字的分布情况;(5)查找记录的频率。

0 0
原创粉丝点击