[ACM] hdu 1251 统计难题 (字典树)

来源:互联网 发布:经济数据公布时间表 编辑:程序博客网 时间:2024/05/18 00:36

统计难题



Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
 

Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

注意:本题只有一组测试数据,处理到文件结束.
 

Output
对于每个提问,给出以该字符串为前缀的单词的数量.
 

Sample Input
bananabandbeeabsoluteacmbabbandabc
 

Sample Output
2310
 

Author
Ignatius.L


解题思路:

这是第一次做字典树的题目。字典树百度百科:又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。

学习了字典树之后,觉得它很明显的就是用空间来换时间,空间复杂度特别大,比如字典数单单存26个小写字母,那么每个节点的孩子节点都有26个孩子节点,字典树中的每一层都保留着不同单词的相同字母。

为了好说明,假设,所有的单词只包括a,b,c,d四个字母,那么树是这样建立的。


题目是要求统计出以某个字符串为前缀的单词数量,字典树入门题。

代码:

[cpp] view plaincopy在CODE上查看代码片派生到我的代码片
  1. #include <iostream>  
  2. #include <string.h>  
  3. #include <stdio.h>  
  4. #include <malloc.h>  
  5. using namespace std;  
  6. char str[12];  
  7. const int maxn=26;//孩子节点的最大个数,如果是只有26个字母,就用26就可以了。  
  8.   
  9. struct Trie//树的结构体  
  10. {  
  11.     int cnt;//保存某个字母出现的次数  
  12.     Trie *next[maxn];//每一个节点对应着多少个孩子,如果只有26个字母,就用26就可以了  
  13. };  
  14.   
  15. Trie root;  
  16.   
  17. /*void init(Trie t) 
  18. { 
  19.     for(int i=0;i<26;i++) 
  20.         t.next[i]=NULL; 
  21. }*///不需要单独对根节点初始化  
  22.   
  23. void CreateTrie(char *str)  
  24. {  
  25.     int len=strlen(str);  
  26.     Trie *p=&root,*q;  
  27.     for(int i=0;i<len;i++)  
  28.     {  
  29.         int id=str[i]-'a';  
  30.         if(p->next[id]==NULL)//第一次遇到  
  31.         {  
  32.             q=(Trie*)malloc(sizeof(Trie));  
  33.             q->cnt=1;//此处一开始写错,写成了q->cnt++;  
  34.             for(int i=0;i<maxn;i++)  
  35.                 q->next[i]=NULL;//初始化非空节点的孩子节点  
  36.             p->next[id]=q;//在树中填上  
  37.             p=p->next[id];//此时的P是不为空的节点  
  38.         }  
  39.         else  
  40.         {  
  41.             p->next[id]->cnt++;//不是第一次遇到,个数++  
  42.             p=p->next[id];  
  43.         }  
  44.     }  
  45. }  
  46.   
  47. int find(char *str)  
  48. {  
  49.     int len=strlen(str);  
  50.     Trie *p=&root;  
  51.     for(int i=0;i<len;i++)  
  52.     {  
  53.         int id=str[i]-'a';  
  54.         p=p->next[id];//一直向下走。  
  55.         if(p==NULL)//找不到该单词,一开始此处写错了,写成了p->next[id]==NULL  
  56.             return 0;  
  57.     }  
  58.     return p->cnt;  
  59. }  
  60. int main()  
  61. {  
  62.     while(gets(str)&&str[0]!='\0')  
  63.     {  
  64.         CreateTrie(str);  
  65.     }  
  66.     while(scanf("%s",str)!=EOF)  
  67.     {  
  68.         printf("%d\n",find(str));  
  69.     }  
  70.     return 0;  
  71. }  
0 0
原创粉丝点击