字典树

来源:互联网 发布:手机版淘宝怎么买彩票 编辑:程序博客网 时间:2024/06/06 14:12

原创

字典树

字典树,又称单词查找树,Trie树,是一种树形结构,哈希表的一个变种。用于统计,排序和保存大量的字符串(也可以保存其

的)。

优点就是利用公共的前缀来节约存储空间。在这举个简单的例子:比如说我们想储存3个单词,nyist、nyistacm、nyisttc。如果只是

单纯的按照以前的字符数组存储的思路来存储的话,那么我们需要定义三个字符串数组。但是如果我们用字典树的话,只需要定义

一个树就可以了。在这里我们就可以看到字典树的优势了。



基本的操作

1.定义(即定义结点)

[cpp] view plain copy
 print?
  1. struct node{    
  2.     int cnt;    
  3.     struct node *next[26];    
  4.     node(){    
  5.         cnt=0;    
  6.         memset(next,0,sizeof(next));    
  7.     }    
  8. };   

next是表示每层有多少种类的数,如果只是小写字母,则26即可,若改为大小写字母,则是52,若再加上数字,则是62了,这里根

据题意来确定。

cnt可以表示一个字典树到此有多少相同前缀的数目,这里根据需要应当学会自由变化。

2.插入(即建树过程)

构建Trie树的基本算法也很简单,无非是逐一把每则单词的每个字母插入Trie。插入前先看前缀是否存在。如果存在,就共享,否则

创建对应的节点和边。比如要插入单词add(已经插入了单词“ad”),就有下面几步:

    考察前缀"a",发现边a已经存在。于是顺着边a走到节点a。

    考察剩下的字符串"dd"的前缀"d",发现从节点a出发,已经有边d存在。于是顺着边d走到节点ad

    考察最后一个字符"d",这下从节点ad出发没有边d了,于是创建节点ad的子节点add,并把边ad->add标记为d。

[cpp] view plain copy
 print?
  1. void buildtrie(char *s){    
  2.     node *p = root;    
  3.     node *tmp = NULL;    
  4.     int l = strlen(s);    
  5.     for(int i = 0; i < l; ++i){    
  6.         if(p->next[s[i]-'a'] == NULL){    
  7.             tmp = new node;    
  8.             p->next[s[i]-'a'] = tmp;    
  9.         }    
  10.         p = p->next[s[i]-'a'];    
  11.         p->cnt++;    
  12.     }    
  13. }  

3.查找

(1)每次从根结点开始进行搜索;

(2)取要查找关键词的第一个字母,并根据该字母选择对应的子树并转到该子树继续进行检索;

(3)在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索; 

(4)迭代刚才过程。。。

(5)直到在某个结点处:

——关键词的所有字母都被取出,则读取附在该结点上的信息,即完成查找。

——该结点没有任何信息,则输出该关键词不在此字典树里。

[cpp] view plain copy
 print?
  1. void findtrie(char *s){    
  2.     node *p = root;    
  3.     int l = strlen(s);    
  4.     for(int i = 0; i < l; ++i){  
  5.         if(p->next[s[i]-'a'] == NULL){  
  6.             printf("0\n");    
  7.             return;    
  8.         }    
  9.         p = p->next[s[i]-'a'];    
  10.     }  
  11.     printf("%d\n",p->cnt);    
  12. }  

4.释放内存

有些题目,数据比较大,需要查询完之后释放内存(比如:hdu1671 Phone List)

递归释放内存:

[cpp] view plain copy
 print?
  1. void del(node *root){  
  2.     for(int i = 0; i < 10; ++i)  
  3.         if(root->next[i])  
  4.             del(root->next[i]);  
  5.     delete(root);  
  6. }  

注意事项:

1.用G++交会出现Memory Limit Exceeded(就算释放了内存,还是Memory Limit Exceeded)

2.根结点要初始化root=new node;  

练习:

hdu 1251 统计难题

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1251

解题思路:http://blog.csdn.net/piaocoder/article/details/41552691


hdu 2072 单词数

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2072

解题思路:http://blog.csdn.net/piaocoder/article/details/41902793


hdu 1671 Phone List

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1671

解题思路:http://blog.csdn.net/piaocoder/article/details/47951011


POJ 2001 Shortest Prefixes

题目链接:http://poj.org/problem?id=2001

解题思路:http://blog.csdn.net/piaocoder/article/details/47731321


POJ 2418 Hardwood Species

题目链接:http://poj.org/problem?id=2418

解题思路:http://blog.csdn.net/piaocoder/article/details/47731453


POJ 2503 Babelfish 

题目链接:http://poj.org/problem?id=2503

解题思路:http://blog.csdn.net/piaocoder/article/details/47731701


原创粉丝点击