一个非常重要的查找算法--哈希表查找(SearchHash)

来源:互联网 发布:手机qq电话录音软件 编辑:程序博客网 时间:2024/06/05 11:42

///////////

数据结构比较抽象,逻辑性较强,一些算法不能够一次理解的较好,因此经常的看一下,做一下思维的体操,你就理解的比较深入了。

//////////////

 

哈希查找是通过计算数据元素的存储地址进行查找的一种方法。

操作步骤:

step1 取数据元素的关键字key,计算其哈希函数值。若该地址对应的存储空间还没有被占用,则将该元素存入,否则执行step2解决冲突。
step2 根据选择的冲突处理方法,计算关键字key的下一个存储地址。若下一个存储地址仍被占用,则继续执行step2,直到到能用的存储地址为止。

 

哈希查找的本质是先将数据映射成它的哈希值。哈希查找的核心是构造一个哈希函数,它将原来直观、整洁的数据映射为看上去似乎是随机的一些整数。

本算法使用开放定址的方法解决冲突。

程序的源代码如下:

//哈希表的查找#include<stdio.h>#include<malloc.h>#include<process.h>#define OVERFLOW -2#define SUCCESS 1#define UNSUCCESS 0#define DUPLICATE -1#define NULL_KEY 0 //0为未填写记录的标志typedef int Status;#define OK 1#define N 10//开放定址哈希表的存储结构int Hashsize[]={11, 19, 29, 37};//哈希表的容量递增,一个合适的素数序列int m=0;//哈希表的表长,全局变量struct ElemType //数据元素的类型{int key;int others;};struct HashTable{ElemType *elem;//数据元素的存储基址,动态分配数组int count;//当前数据元素的个数int sizeindex;//Hashsize[sizeindex]为当前的容量};//构造一个空的哈希表void InitHash(HashTable &H){int i;H.count=0;//当前的元素的个数H.sizeindex=0;//初始存储容量分配为Hashsize[0]m=Hashsize[0];H.elem=(ElemType*)malloc(m*sizeof(ElemType));if(!H.elem)exit(OVERFLOW);for(i=0;i<m;i++)H.elem[i].key=NULL_KEY;//未填写记录的标志}//一个简单的哈希函数unsigned int Hash(int K){return K%m;}//开放定址法处理冲突,线性探测再散列void collision(int &p,int d){p=(p+d)%m;}//在开放定址哈希表H中查找关键码为K的数据元素,若查找成功p指示待查找的元素在表中的位置//返回SUCCESS//否则以p指示插入位置,并返回UNSUCCESS//c用以记录冲突的次数,其初值为0,供建表插入时参考Status SearchHash(HashTable H,int K,int &p,int &c){p=Hash(K);//求得哈希地址while(H.elem[p].key != NULL_KEY && K != H.elem[p].key){//该位置中填有记录,且关键字不相等c++;//冲突次数加1if(c<m)collision(p,c);//求得下一个探查地址elsebreak;}if(K == H.elem[p].key)return SUCCESS;//查找成功,p返回待查数据元素的位置elsereturn UNSUCCESS;//查找不成功,p返回的是插入位置}Status InsertHash(HashTable &,ElemType);//函数的声明//重建哈希表void RecreateHashTable(HashTable &H){int i;int count = H.count;ElemType *elem;ElemType *p;elem = (ElemType*)malloc(count*sizeof(ElemType));if(!elem)exit(OVERFLOW);p=elem;printf("重加哈希表.\n");//保存原有的数据到elem中for(i=0;i<m;i++){if((H.elem+i)->key != NULL_KEY)//该单元有数据{*p=*(H.elem+i);p++;}}H.count=0;H.sizeindex++;//增加存储容量m=Hashsize[H.sizeindex];p=(ElemType*)realloc(H.elem,m*sizeof(ElemType));if(!p)exit(OVERFLOW);H.elem=p;for(i=0;i<m;i++)H.elem[i].key=NULL_KEY;//未填记录的标志(初始化)//将原来的数据按照新的表长插入到重建的哈希表中for(p=elem;p<elem+count;p++) //count是原来的长度InsertHash(H,*p);}//查找不成功时将数据元素e插入到开放定址的哈希表H中,并返回OK//如果冲突次数过大就重建哈希表Status InsertHash(HashTable &H,ElemType e){int p;int c=0;if(SearchHash(H,e.key,p,c))//表中已经存在与关键字相同的元素{return DUPLICATE;}else if(c<Hashsize[H.sizeindex]/2)//冲突次数未达到上限(可以调节){//插入eH.elem[p]=e;++H.count;return OK;}else{//冲突次数达到上限RecreateHashTable(H);return UNSUCCESS;}}//按照哈希地址的顺序遍历哈希表void TraverseHash(HashTable H,void(*Visit)(int,ElemType)){printf("哈希地址0~%d\n",m-1);for(int i=0;i<m;i++)if(H.elem[i].key !=NULL_KEY )//有数据Visit(i,H.elem[i]);}//被TraverseHashTable函数调用void print(int p,ElemType r){printf("address=%d (%d,%d)\n",p,r.key,r.others);}void main(){int p,c=0;int i,j,k;ElemType r[N]={{17,1},{60,2},{29,3},{38,4},{1,5},{2,6},{3,7},{4,8},{60,9},{13,10}};HashTable h;InitHash(h);for(i=0;i<N-1;i++){//插入前N-1个记录j=InsertHash(h,r[i]);if(j == DUPLICATE){printf("表中已经存在关键字为%d的记录,无法继续插入记录(%d,%d)\n",r[i].key,r[i].key,r[i].others);}}printf("按照哈希地址的顺序遍历哈希表:\n");TraverseHash(h,print);printf("请输入要查找的记录的关键字:");scanf("%d",&k);j=SearchHash(h,k,p,c);if(j == SUCCESS)print(p,h.elem[p]);elseprintf("没找到!\n");j=InsertHash(h,r[i]);//插入第N个元素if(j == UNSUCCESS)//重建哈希表j=InsertHash(h,r[i]);//重建哈希表后重新插入printf("按照哈希地址的顺序遍历重建后的哈希表:\n");TraverseHash(h,print);printf("请输入要查找的记录的关键字:");scanf("%d",&k);j=SearchHash(h,k,p,c);if(j == SUCCESS)print(p,h.elem[p]);elseprintf("没找到!\n");}

程序的运行结果如下:

数据的存储结构:

开放定址法处理冲突哈希表的存储结构                                                      空的哈希表

 

注意在本程序中使用了一个重建哈希表的函数RecreateHashTable(),也就是当你查找指定的元素的时候,如果冲突的次数超过了你设定的次数的时候,就会调用这个重建函数,增加分配的存储空间,使用大一些的控件来存储有限的数据的个数。

在这个RecreateHashTable()重建函数的实现中,先是malloc一段内存空间,然后relloc一段更加大一些的内存空间,然后按照一定的规则把你原来的数据存入到新分配的空间中。注意在上面的的函数的实现的过程中区分elem指针和H.elem指针,就比较容易理解源代码了。

 

1 0
原创粉丝点击