HDU 1251 统计难题（Trie树——字符串算法）

来源：互联网发布：java中的getclass方法编辑：程序博客网时间：2024/05/16 17:51

在vj上拉了一些题，有一题它需要用到trie树。
题目大意是这样的：给一个单词表(只有小写字母组成,不会有重复的单词出现),让我们统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).

Sample Input

bananabandbeeabsoluteacmbabbandabc

Sample Output

这种前缀的问题，在我不知道trie树的时候，就暴力嘛（暴力出真知/斜眼笑）！每个字符串从单词表开始到结尾依次判断，但是时间复杂度就很大了，这个复杂度有O(n^2)，如果n很大，这显然是不好的。

所以介绍trie算法。
参考一位巨巨的文章：
http://blog.csdn.net/hackbuteer1/article/details/7964147

prie树：

特征：

（1）根节点设为空，其他的每个节点只包含一个字符。
（2）从根节点到树中的某一个节点，路上经过的字符从上到下连接起来，为该节点对应的字符串。

举例：

bananabandbeeabsoluteacmNULL ->a->b->s->o->l->u->t->e        ->c->m     ->b->a->n->a->n->a              ->d

因为没有找到合适的画树图软件，就用上面的表示，从NULL开始，同一列的为同一层。
Trie树结点结构体声明如下。

typedef struct Trie_node  {      int count;                    // 统计从根节点到此结点的字符串出现的次数      struct Trie_node* next[26];   // 指向各个子树的指针，字母26个      bool exist;                   // 标记此结点是否构成单词}TrieNode , *Trie;

创建新结点：

用malloc开辟一个地址，将此结点的count置0，子树置空，构成单词标记置false。

TrieNode* createTrieNode(){    TrieNode* node = (TrieNode *)malloc(sizeof(TrieNode));    node->count = 0;    node->exist = false;    memset(node->next, NULL, sizeof(node->next));    return node;}

创建单词表：

这里就开始了trie树的build了，注意从根结点开始进行建树，过程通过字符的id来判断子树是否被创建过，如果没有创建过，就malloc一个子结点，然后到达子节点，依次往下。

举例：
注意括号中为count数

单词1：banana：

NULL ->b(1)->a(1)->n(1)->a(1)->n(1)->a(1)  此单词构建完成，最后一个a结点的exit置为true。

单词2：band：

NULL->b(2)->a(2)->n(2)->a(1)->n(1)->a(1)                      ->d(1)此单词构建完毕，发现结点b,a,n的count数变成了2，并且结点d的exit置为true。

代码如下：

void Trie_insert(Trie root, char* word){    Trie node = root;    char *p = word;    int id;    while( *p )    {        id = *p - 'a';        if(node->next[id] == NULL)        {            node->next[id] = createTrieNode();        }        node = node->next[id];        ++p;        node->count += 1;    }    node->exist = true;}

查询：

从NULL开始，取s[i]，依次判断node->next[s[i]-‘a’]是否为空，如果为空，说明单词中没有要查询的字符串的字符，则返回0；否则就取最后一个结点的count。

就上面的例子来看，即现在的trie树为：

NULL->b(2)->a(2)->n(2)->a(1)->n(1)->a(1)                      ->d(1)

我们查询字符串s为“ba”：
1.先是‘b’：从NULL开始发现下一个结点是b，继续
2.最后是‘a’：从b开始发现下一个结点是a，则返回2。

单词表是banana 和 band ，查询的是“ba”，的确是两个单词的前缀。

int Trie_search(Trie root, char* word){    Trie node = root;    char *p = word;    int id;    while( *p )    {        id = *p - 'a';        node = node->next[id];        ++p;        if(node == NULL) return 0;    }    return node->count;}

完整代码如下：

#include<cstdio>#include<cstring>#include<iostream>#include<malloc.h>using namespace std;/*声明结构体*/typedef struct Trie_node{    int count;    struct Trie_node* next[26];    bool exist;}TrieNode, *Trie;/*创建新结点*/TrieNode* createTrieNode(){    TrieNode* node = (TrieNode *)malloc(sizeof(TrieNode));    node->count = 0;    node->exist = false;    memset(node->next, NULL, sizeof(node->next));    return node;}/*建trie树*/void Trie_insert(Trie root, char* word){    Trie node = root;    char *p = word;    int id;    while( *p )    {        id = *p - 'a';        if(node->next[id] == NULL)        {            node->next[id] = createTrieNode();        }        node = node->next[id];        ++p;        node->count += 1;    }    node->exist = true;}/*查询*/int Trie_search(Trie root, char* word){    Trie node = root;    char *p = word;    int id;    while( *p )    {        id = *p - 'a';        node = node->next[id];        ++p;        if(node == NULL) return 0;    }    return node->count;}int main(){    Trie root = createTrieNode();    char str[12];    bool flag = false;    while(gets(str))    {        if(flag) printf("%d\n", Trie_search(root, str));        else{            if(strlen(str) != 0)            {                Trie_insert(root, str);            }else{                flag = true;            }        }    }    return 0;}

0 0

HDU 1251 统计难题 （Trie树——字符串算法）

prie树：

特征：

创建新结点：

创建单词表：

查询：

HDU 1251 统计难题（Trie树——字符串算法）