程序博客网 > 人工智能程序发展

散列 - C语言实现（摘自数据结构与算法分析 C语言描述）

来源：互联网发布：人工智能程序发展编辑：程序博客网时间：2024/04/30 01:58

一、概述

　　散列表（hash table）ADT只支持二叉查找树所允许的一部分操作，散列表的实现常常叫做散列（hashing）。散列是一种以常数平均时间执行插入、删除和查找的技术。但是，那些需要元素间任何排序信息的操作将不会得到有效的支持。

二、实现

　　理想的散列表数据结构只不过是一个包含有关关键字的具有固定大小的数组。典型情况下，一个关键字就是一个带有相关值的字符串。我们把表的大小记作TableSize，并将其理解为散列数据结构的一部分而不仅仅是浮动于全局的某个变量。通常的习惯是让表从０到TableSize - 1变化。每个关键字被映射到从０到TableSize - 1这个范围中的某个数，并且被放到适当的单元中。这个映射就叫做散列函数（hash function），理想情况下它应该运算简单并且应该保证任何两个不同的关键字映射到不同的单元。不过，这是不可能的，因为单元的数目是有限的，而关键字实际上是用不完的。因此，我们寻找一个散列函数，该函数要在单元之间均匀地分配关键字。

　　这就是散列的基本想法。剩下的问题则是要选择一个函数，决定当两个关键字散列到同一个值的时候（称为冲突（collision））应该做什么以及如何确定散列表的大小。

如果输入的关键字是整数，则一般合理的方法就是直接返回“Key mod Tablesize”的结果，除非Key碰巧具有某些不理想的性质。在这种情况下，散列函数的选择需要仔细考虑。

　　解决冲突的方法有几种，我们将讨论其中最简单的两种：分离链接法和开放定址法。

１. 分离链接法

　　其做法是将散列到同一个值的所有元素保留到一个表中，为方便起见，这些表都有表头（表的大小不是素数，用在这里是为了简单），如图１所示。

图１　分离链接散列表

文件名：hashsep.h

[cpp] view plaincopyprint?

#ifndef _HashSep_H
typedef int ElementType;
typedef unsigned int Index;
struct ListNode;
typedef struct ListNode *Position;
struct HashTbl;
typedef struct HashTbl *HashTable;
Index Hash( const int Key, int TableSize );
HashTable InitializeTable( int TableSize );
void DestroyTable( HashTable H );
Position Find( ElementType Key, HashTable H );
void Insert( ElementType Key, HashTable H );
ElementType Retrieve( Position P );
/* Routines such as Delete and MakeEmpty are omitted */
#endif /* _HashSep_H */

文件名：hashsep.c

[cpp] view plaincopyprint?

文件名：main.c

[cpp] view plaincopyprint?

#include "hashsep.h"
#include <stdio.h>
int main()
{
HashTable H = InitializeTable( 10 );
int i;
printf( "HashTable:\n" );
for ( i = 1; i < 11; i++ )
{
Insert( i * i, H );
printf( "%d:%d\n", i*i, Hash( i * i, 10 ) );
}
return 0;
}

２. 开放定址法

分离链接散列算法的缺点是需要指针，由于给新单元分配地址需要时间，因此就导致算法的速度多少有些减慢，同时算法实际上还要求对另一种数据结构的实现。除使用链表解决冲突外，开放定址散列法（Open addressing hashing）是另外一种不用链表解决冲突的方法。在开放定址散列算法系统中，如果有冲突发生，那么就要尝试选择另外的单元，直到找出空的单元为止。

文件名：hashquad.h

[cpp] view plaincopyprint?

#ifndef _HashQuad_H
typedef int ElementType;
typedef unsigned int Index;
typedef Index Position;
struct HashTbl;
typedef struct HashTbl *HashTable;
static int NextPrime( int N );
Index Hash( ElementType Key, int TableSize );
HashTable InitializeTable( int TableSize );
void DestroyTable( HashTable H );
Position Find( ElementType Key, HashTable H );
void Insert( ElementType Key, HashTable H );
ElementType Retrieve( Position P, HashTable H );
HashTable Rehash( HashTable H );
/* Routines such as Delete and MakeEmpty are omitted */
#endif /* _HashQuad_H */

文件名：hashquad.c

[cpp] view plaincopyprint?

文件名：main.c

[cpp] view plaincopyprint?

#include "hashquad.h"
#include <stdio.h>
int main()
{
HashTable H = InitializeTable( 10 );
int i;
printf( "Hash Table: \n" );
for ( i = 1; i < 11; i++ )
{
Insert( i * i, H );
printf( "%d:%d\n", i*i, Hash( i * i, 10 ) );
}
return 0;
}

附录：上述代码中用到了Error、FatalError等函数，其实现如下（即fatal.h文件）：

[cpp] view plaincopyprint?

#include <stdio.h>
#include <stdlib.h>
#define Error( Str ) FatalError( Str )
#define FatalError( Str ) fprintf( stderr, "%s\n", Str ), exit( 1 )

0 0

人工智能程序发展

人工智能程序发展

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子乀l 乀乀人子g子乀怎么读乀一式爻一丶1 丶乀沙乀什么意思乀怎么打 0厂i乀一乀一乁乁怎么读乁术趣乁乙一l一乁怎么打乁打一成语乂中乂乂怎么读秋收起乂南昌起乂司马乂燕然已勒哲乂乂字可用来取名字吗 x乂x性法国乂的读音松本乂亻在线播放乂是什么意思 zoo乄乂黑人乃妻乃乃的 \'乃梦乃华星乃星爱桃乃木香奈乃组词星乃星洪荒吾乃阎罗大帝如月未罗乃安乃近作用与功效我乃路易十四