Hash冲突处理终极版

来源:互联网 发布:淘宝商城女包特卖 编辑:程序博客网 时间:2024/05/16 11:03

对于Hash,我们是怎样来处理冲突的。现在就来介绍一些经典的Hash冲突处理的方法。主要包括

 

  (1)开放地址法

  (2)拉链法

  (3)再哈希法

  (4)建立公共溢出区

 

(1)开放地址法

 

    基本思想:当发生地址冲突时,按照某种方法继续探测Hash表中其它存储单元,直到找到空位置为止。描述如下

 

    

 

    其中为关键字的直接Hash地址,Hash表的长度,

    每次再探测时的地址增量。根据的不同取法,有不同的称呼。

 

    线性探测再散列    

    二次探测再散列    

    伪随机再散列       伪随机数

 

(2)拉链法

   

    拉链法又叫链地址法,适合处理冲突比较严重的情况。基本思想是把所有关键字为同义词的记录存储在同一个

    线性链表中。

 

代码:

#include <iostream>#include <string.h>#include <stdio.h>using namespace std;const int N = 35;struct node{    int key;    //关键字    int len;    //每个节点引出的链表长度    bool flag;  //有数据的标志    node *next;};node list[N];void Init(node list[]){    for(int i=0; i<N; i++)    {        list[i].len = 0;        list[i].flag = 0;        list[i].next = NULL;    }}void Insert(node list[], int val, int m){    int id = val % m;    if(!list[id].flag)    {        list[id].key = val;        list[id].flag = 1;    }    else    {        node *p = new node();        p->key = val;        p->next = list[id].next;        list[id].next = p;    }}//输出HashTablevoid Print(node list[], int m){    for(int i=0; i<m; i++)    {        node *p = list[i].next;        if(!list[i].flag)            printf("The %dth record is NULL!\n", i);        else        {            printf("The %dth record is %d", i, list[i].key);            list[i].len++;            while(p)            {                printf("->%d", p->key);                p = p->next;                list[i].len++;            }            puts("");        }    }}//计算平均查找长度double ASL(node list[], int m){    double ans = 0;    for(int i=0; i<m; i++)        ans += (list[i].len + 1) * list[i].len / 2.0;    return ans / m;}int main(){    int n, m;    Init(list);    scanf("%d %d", &n, &m);    for(int i=0; i<n; i++)    {        int val;        scanf("%d", &val);        Insert(list, val, m);    }    Print(list, m);    printf("The Average Search Length is %.5lf\n", ASL(list, m));    return 0;}/**12 1147 7 29 11 16 92 22 8 3 37 89 50*/


关于拉链法还可以参考:http://www.51nod.com/question/index.html#!questionId=1191

 

(3)再哈希法

 

    再哈希法又叫双哈希法,有多个不同的Hash函数,当发生冲突时,使用第二个,第三个,....,等哈希函数

    计算地址,直到无冲突。虽然不易发生聚集,但是增加了计算时间。

 

(4)建立公共溢出区

 

    建立公共溢出区的基本思想是:假设哈希函数的值域是[1,m-1],则设向量HashTable[0...m-1]为基本

    表,每个分量存放一个记录,另外设向量OverTable[0...v]为溢出表,所有关键字和基本表中关键字为同义

    词的记录,不管它们由哈希函数得到的哈希地址是什么,一旦发生冲突,都填入溢出表。

 

 

   

3 1
原创粉丝点击