看数据结构写代码（61）哈希表

来源：互联网发布：企业级网管软件编辑：程序博客网时间：2024/05/22 04:47

前面说的各种查找都是基于 “比较” 的基础来进行查找的。查找的效率要看比较的次数。那么有没有不需要比较，就可以找到想要的数据的方法呢？

哈希表就是这样的一种方法，它用数组作为保存关键字的数据原型，通过一个哈希函数f(k)，来找到关键字存储的位置，从而找到想要的信息。

例如我们想要解决这样的一个问题：

假设这有一个各种字母组成的字符串，假设这还有另外一个字符串，而且这个字符串里的字母数相对少一些。什么方法能最快的查出所有小字符串里的字母在大字符串里都有？

比如，如果是下面两个字符串：

String 1: ABCDEFGHLMNOPQRS

String 2: DCGSRQPOM

我们可以用一个分配一个 26 个 int 型的整形数组 a，将 0~25 分别代表 A~Z 是否出现，如果出现则值为 1，没有出现值为0.

则我们只需遍历 String1，然后将对应的元素设置为1，然后遍历 String2 ，如果查找过程中，遇到了 0 值，则不是。否则 String2 的字母在 String1 中都存在。

哈希表虽然快速，但是其数据原型基于数组，同样有缺陷。

当查找的元素集合太大，不同的关键字，却得到同样的地址。即 k1 != k2,， F(K1) = = F(K2)，这时叫做冲突。冲突是无法避免的。只能通过一些方法减少冲突。当我们插入元素时，寻找插入位置，造成的冲突次数太多，影响查找效率，我们只能重新建表，这是个费时的过程。

而且哈希是无法按从小到大遍历数据的。

所以我们在用哈希的时候得考虑这些：

1.哈希函数

2冲突函数

3初始表长

4冲突多少次，我们就重新建表,

5.是否需要顺序遍历。

下面代码用的是

哈希函数：除整取余法

冲突函数：开发定址法（线性）

冲突次数到达表长的一半就重新建表。

哈希表基本结构，初始化和销毁

#include "stdafx.h"#include <cstdlib>int hashSize[] = {11,13,17,19};//哈希表容量增加 数组.#define NULL_KEY0struct HashTable{int * base;//数据的基址int count;//表的数量int sizeIndex;//表的容量大小的索引};void initHash(HashTable * t){t->sizeIndex =0;t->base = (int *)calloc(hashSize[t->sizeIndex],sizeof(int));t->count = 0;}void destoryHash(HashTable * t){free(t->base);t->base = NULL;t->sizeIndex = 0;t->count = 0;}

哈希函数：

//除留余数法int hash(HashTable t,int key){return key % hashSize[t.sizeIndex];}

冲突函数：

//开发定址 线性探索解决冲突法int collision(HashTable t,int key,int times){return (key + times) % hashSize[t.sizeIndex];}

查找函数：

int search(HashTable t,int key,int * index,int *ctimes){*index = hash(t,key);*ctimes = 0;while (t.base[*index] != NULL_KEY && t.base[*index] != key){(*ctimes)++;*index = collision(t,key,*ctimes);}printf("------------查找%d, 查找了%d次--------------\n",key,*ctimes+1);if (t.base[*index] == key){return t.base[*index];}else{return NULL_KEY;}}

插入关键字，以及重建表函数：

void reCreateHashTable(HashTable * t,int key);void insertHash(HashTable *t,int key){int index;//插入位置intctimes;//冲突次数int result = search(*t,key,&index,&ctimes);if (result == NULL_KEY && ctimes < hashSize[t->sizeIndex]/2){//没找到t->base[index] = key;t->count ++;}else{//重新建表reCreateHashTable(t,key);}}//void reCreateHashTable(HashTable * t,int key){printf("--------------重建哈希表----------------\n");int * oldBase = t->base;//保存老空间.int oldSize = hashSize[t->sizeIndex];//老空间的容量大小t->sizeIndex++;int newSize = hashSize[t->sizeIndex];//新空间大小t->base = (int *) calloc(newSize,sizeof(int));//新空间//插入之前将 表的数量置0t->count = 0;for (int i = 0; i < oldSize; i++){if (oldBase[i] != NULL_KEY){insertHash(t,oldBase[i]);}}free(oldBase);//释放老空间insertHash(t,key);//插入冲突的关键字.}

测试函数：

static int testArray[10] = {1,18,7,55,23,45,98,76,35,29};int _tmain(int argc, _TCHAR* argv[]){HashTable table;initHash(&table);for (int i = 0; i < 10; i++){insertHash(&table,testArray[i]);}int index ,count;for (int i = 0; i < 10; i++){search(table,testArray[i],&index,&count);}destoryHash(&table);return 0;}

代码工程文件网盘地址：http://pan.baidu.com/s/1kToXLcj

0 0

看数据结构写代码（61） 哈希表

看数据结构写代码（61）哈希表