哈希表的创建

来源:互联网 发布:大数据工具简单 编辑:程序博客网 时间:2024/05/20 02:25

  在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使每个关键字和表中唯一的存储位置相对应,称这个对应关系f为哈希(散列)函数,根据这个思想建立的表为哈希表。
  若key1≠key2, 而f(key1)=f(key2), 则这种现象称为冲突,且key1和key2对哈希函数f来说是同义词。
  根据设定的哈希函数f=H(key)和处理冲突的方法,将一组关键字映像到一个有限的连续的地址集上,并以关键字在地址集中的”象”作为记录在表中的存储位置,这一映像过程,称为构造哈希表(散列表)。
  哈希函数常见的构造方法有5种:
  直接定址法、数字分析法、平方取中法、除留余数法、随机数法等。
  注意,在使用除留余数法 H(key)=key Mod p (p≤m)时,对除数p的选择很重要,若p选的不好,则很容易产生同义词。一般,将p选为素数。
  哈希函数处理冲突的方法常见的有2种:
  a) 开放地址法
  在该方法中,又细分为:线性探查法、平方探查法、伪随机数序列法、双哈希函数法等等。
  b)拉链法
  拉链法是把所有的同义词,用单链表链接起来的方法。在这种方法中,哈希表每个单元中存放的不再是记录本身,而是相应同义词单链表的头指针。
  哈希表的平均查找长度ASL = F(α),即哈希表的平均查找长度只与装填因子α有关,与哈希表的长度n无关。哈希表的时间复杂度一般为O(1)。
  例如,设计一个哈希表ha[0..m-1]存放n个元素,哈希函数采用除留余数法H(key)=key % p (p≤m), 解决冲突的方法采用开放定址法中的线性探查法。
  1) 设计哈希表的类型;
  2) 设计在哈希表中查找指定关键字的算法;
  3) 设计在哈希表中删除指定关键字的算法;
  4) 设计在哈希表中插入指定关键字的记录的算法;
  5) 设计一组关键字建立哈希表的算法;
  6) 设计输出哈希表的算法
  7) 求查找成功时,平均查找长度的算法;
  解:
   哈希表 ha[0..m-1]
   存放元素个数 n个
   哈希函数 H(key)= key % p (p≤m)
   线性探查法 Hi(k)=(H(k)+i)modm,(1im1)
    1)设计哈希表的类型如下:  

#define MaxSize 100      //定义最大哈希表长度#define NULLKEY -1       //定义空关键字值#define DELKEY -2        //定义被删关键字值typedef int KeyType;     //关键字类型typedef char *InfoType;  //其他数据类型typedef struct{    KeyType key;        //关键字域    InfoType data;      //其他数据域    int count;          //探查次数域}HashTable[MaxSize];    //哈希表类型

 2)在哈希表中查找关键字为k的记录的过程:根据建表时设定的哈希函数H, 计算出哈希地址H(k), 若表中该地址单元不为空(关键字值NULLKEY表示为空)且该地址的关键字不等于k, 则按建表时设定的处理冲突的方法找下一个地址(这里采用线性探查法找下一个地址),如此反复下去,直到某个地址单位为空(查找失败,返回-1)或者关键字比较相等(查找成功,返回该地址)为止。对应的算法如下: 

//在哈希表中查找关键字kint SearchHT(HashTable ha,int p,KeyType k){    int i=0,adr;    adr = k%p;    while (ha[adr].key!=NULLKEY && ha[adr].key!=k)    {        i++;             //采用线性探查法找下一个地址        adr = (adr+1)%p;    }    if(ha[adr].key==k)  //查找成功        return adr;    else                //查找失败        return -1;}

 3) 在哈希表中删除关键字为k的记录的过程:采用开放定址法处理冲突的哈希表上执行删除操作,只能在被删记录上做删除标记,而不能真正删除记录。在这里设删除标记为DELKEY。对应的算法如下: 

//删除哈希表中关键字kint DeleteHT(HashTable ha,int p,int k,int &n){    int adr;    adr = SearchHT(ha,p,k);    if (adr!=-1)   //在哈希表中找到关键字    {        ha[adr].key=DELKEY;        n--;       //哈希表长度减1        return 1;    }    else            //在哈希表中未找到该关键字        return 0;}

 4) 插入算法首先调用查找算法,若在表中找到待插入的关键字,则插入失败;若在表中找到一个开放地址,则将待插入的结点插入其中,即插入成功。对应的算法如下: 

//将关键字k插入到哈希表中void InsertHT(HashTable ha,int &n,KeyType k,int p){    int i,adr;    adr = k%p;    if (ha[adr].key==NULLKEY || ha[adr].key==DELKEY)  //x[j]可以直接放在哈希表中    {        ha[adr].key=k;        ha[adr].count=1;    }     else      //发生冲突时,采用线性探查法解决冲突    {        i=1;  //i记录x[j]发生冲突的次数        do         {            adr = (adr+1)%p;            i++;        } while (ha[adr].key!=NULLKEY && ha[adr].key!=DELKEY);        ha[adr].key=k;        ha[adr].count=i;    }    n++;}

 5) 建立哈希表的过程:先要将表中个结点的关键字清空,使其地址为开放的,然后调用插入算法将给定的关键字序列依次插入表中。对应的算法如下: 

//创建哈希表void CreateHT(HashTable ha,KeyType x[],int n,int m,int p){    int i,n1=0;    for (i=0;i<m;i++)  //哈希表置初值    {        ha[i].key=NULLKEY;        ha[i].count=0;    }    for(i=0;i<n;i++)        InsertHT(ha,n1,x[i],p);}

 6) 输出一个哈希表的算法如下: 

//输出哈希表void DispHT(HashTable ha,int n,int m){    float avg=0;    int i;    printf(" 哈希表地址:\t");    for(i=0;i<m;i++)        printf(" %3d",i);    printf("\n");    printf(" 哈希表关键字:\t");    for(i=0;i<m;i++)        if(ha[i].key==NULLKEY || ha[i].key==DELKEY)            printf("   "); //输出3个空格        else            printf(" %3d",ha[i].key);    printf(" \n");    printf(" 搜索次数:\t");    for(i=0;i<m;i++)        if(ha[i].key==NULLKEY || ha[i].key==DELKEY)            printf("   "); //输出3个空格        else            printf(" %3d",ha[i].count);    printf("\n");    for(i=0;i<m;i++)        if(ha[i].key!=NULLKEY && ha[i].key!=DELKEY)            avg=avg+ha[i].count;    avg=avg/n;    printf(" 平均搜索长度ASL(%d)=%.3g\n",n,avg);}

 7) 求查找成功时的平均查找长度的算法如下:

//查找成功时,平均查找长度void CompASL(HashTable ha,int m){    int i;    int s=0,n=0;    for (i=0;i<m;i++)        if(ha[i].key!=DELKEY && ha[i].key!=NULLKEY)        {            s=s+ha[i].count;            n++;        }    printf(" 查找成功的ASL=%.3g\n",s*1.0/n);}

完整代码如下:

#include <stdio.h>#define MaxSize 100      //定义最大哈希表长度#define NULLKEY -1       //定义空关键字值#define DELKEY -2        //定义被删关键字值typedef int KeyType;     //关键字类型typedef char *InfoType;  //其他数据类型typedef struct{    KeyType key;        //关键字域    InfoType data;      //其他数据域    int count;          //探查次数域}HashTable[MaxSize];    //哈希表类型//将关键字k插入到哈希表中void InsertHT(HashTable ha,int &n,KeyType k,int p){    int i,adr;    adr = k%p;    if (ha[adr].key==NULLKEY || ha[adr].key==DELKEY)  //x[j]可以直接放在哈希表中    {        ha[adr].key=k;        ha[adr].count=1;    }     else      //发生冲突时,采用线性探查法解决冲突    {        i=1;  //i记录x[j]发生冲突的次数        do         {            adr = (adr+1)%p;            i++;        } while (ha[adr].key!=NULLKEY && ha[adr].key!=DELKEY);        ha[adr].key=k;        ha[adr].count=i;    }    n++;}//创建哈希表void CreateHT(HashTable ha,KeyType x[],int n,int m,int p){    int i,n1=0;    for (i=0;i<m;i++)  //哈希表置初值    {        ha[i].key=NULLKEY;        ha[i].count=0;    }    for(i=0;i<n;i++)        InsertHT(ha,n1,x[i],p);}//在哈希表中查找关键字kint SearchHT(HashTable ha,int p,KeyType k){    int i=0,adr;    adr = k%p;    while (ha[adr].key!=NULLKEY && ha[adr].key!=k)    {        i++;             //采用线性探查法找下一个地址        adr = (adr+1)%p;    }    if(ha[adr].key==k)  //查找成功        return adr;    else                //查找失败        return -1;}//删除哈希表中关键字kint DeleteHT(HashTable ha,int p,int k,int &n){    int adr;    adr = SearchHT(ha,p,k);    if (adr!=-1)   //在哈希表中找到关键字    {        ha[adr].key=DELKEY;        n--;       //哈希表长度减1        return 1;    }    else            //在哈希表中未找到该关键字        return 0;}//输出哈希表void DispHT(HashTable ha,int n,int m){    float avg=0;    int i;    printf(" 哈希表地址:\t");    for(i=0;i<m;i++)        printf(" %3d",i);    printf("\n");    printf(" 哈希表关键字:\t");    for(i=0;i<m;i++)        if(ha[i].key==NULLKEY || ha[i].key==DELKEY)            printf("   "); //输出3个空格        else            printf(" %3d",ha[i].key);    printf(" \n");    printf(" 搜索次数:\t");    for(i=0;i<m;i++)        if(ha[i].key==NULLKEY || ha[i].key==DELKEY)            printf("   "); //输出3个空格        else            printf(" %3d",ha[i].count);    printf("\n");    for(i=0;i<m;i++)        if(ha[i].key!=NULLKEY && ha[i].key!=DELKEY)            avg=avg+ha[i].count;    avg=avg/n;    printf(" 平均搜索长度ASL(%d)=%.3g\n",n,avg);}//查找成功时,平均查找长度void CompASL(HashTable ha,int m){    int i;    int s=0,n=0;    for (i=0;i<m;i++)        if(ha[i].key!=DELKEY && ha[i].key!=NULLKEY)        {            s=s+ha[i].count;            n++;        }    printf(" 查找成功的ASL=%.3g\n",s*1.0/n);}void main(){    int x[]={16,74,60,43,54,90,46,31,29,88,77};    int n=11,m=13,p=13,i,k=29;    HashTable ha;    CreateHT(ha,x,n,m,p);    printf("\n");DispHT(ha,n,m);    i=SearchHT(ha,p,k);    if (i!=-1)        printf(" ha[%d].key=%d\n",i,k);    else        printf(" 未找到%d\n",k);    k=77;    printf(" 删除关键字%d\n",k);    DeleteHT(ha,p,k,n);    DispHT(ha,n,m);    i=SearchHT(ha,p,k);    if (i!=-1)        printf(" ha[%d].key=%d\n",i,k);    else        printf(" 未找到%d\n",k);    printf(" 插入关键字%d\n",k);    InsertHT(ha,n,k,p);    DispHT(ha,n,m);    printf("\n");}

效果如下:

这里写图片描述

图(1) 哈希函数选为 H(key)= key % 13

1 0