Trie树

来源:互联网 发布:淘宝授权书psd模板 编辑:程序博客网 时间:2024/06/14 08:27

  AC自动机必备前置知识之二
  本篇博客相对于前两篇还是很认真的(毕竟博主自己画图),前面的ST表和KMP对比较抽象,博主自己讲的话很可能把读者带进坑里,所以链接到其他博客(甩锅加偷懒),Trie树比较具象一些,所以博主就自己讲了。
  例题链接(纯模板题):洛谷P2580
  Trie树是一个存储字符串的经典算法,该树的根节点无字母,其余子节点均含有一个字母,从根节点往子节点延伸,经过的节点的字母便组成了单词,所以存储和查询的时间复杂度都为O(n),n为单词长度,但是,每个节点的子节点有26个,会消耗大量的空间,也可能造成很多浪费,但针对单词长度比较友好的题目还是有很好的效果。
  大概的效果如图(没错,这个博主居然自己画图了!!):
  这里写图片描述
  图中的Trie树(省略多余的/被浪费掉的节点)存储了8个单词:AZ , AB , ABC ,ABD , ABE , B , BZZ , BZA(顺序没有什么关系),加了*的节点表示在这里构成了一个单词。
  综上所述,这个数据结构的原理还是非常简单的,存储和查询的复杂度也较低,Trie树的结构体定义如下:

struct node{    int son[26];//26个子节点    bool have,cot;//have表示这个节点存不存在单词    //cot表示是否被搜索到过(这是根据例题要求定的)    node()//初始化    {        memset(son,0,sizeof(son));        cot=0;        have=false;    }};

  插入函数如下:

int num=0;void in(char name[]){    int a=0,b,len=strlen(name);    for(int i=0;i<len;i++)    {        b=name[i]-'a';        if(!trie[a].son[b])        {//如果该节点还没有出现过,就赋一个序号(相当于指向下一个节点的指针)            trie[a].son[b]=++num;        }        a=trie[a].son[b];//跟着序号指针向下走    }    trie[a].have=1;//走到终点的时候将have赋为true,表示这里有个单词}

  查询函数(基于题目)跟插入的跳转过程差不多,只需要在判断情况的时候多加几个if就好了。

int search(char name[]){    int a=0,b,len=strlen(name);    for(int i=0;i<len;i++)    {//序号指针的跳转同上        b=name[i]-'a';        if(!trie[a].son[b])        {//如果这里序号为0,直接返回3            return 3;        }        a=trie[a].son[b];    }    if(!trie[a].have)    {//同上        return 3;    }    if(!trie[a].cot)    {//如果这个单词没有被查询过且存在与Trie树中,返回1        trie[a].cot=1;        return 1;    }    //还有种情况就是这个单词被重复查询,返回2    return 2;}

  Trie树的代码和原理都非常友好,这篇博客博主也自认为写的足够详细,希望对大家有所脾益,下一篇AC自动机绝对粗长。。。
  例题AC代码:

#include<bits/stdc++.h>using namespace std;struct node{    int son[26];    bool have,cot;    node()    {        memset(son,0,sizeof(son));        cot=0;        have=false;    }};node trie[800005];int num(0);void in(char name[]){    int a=0,b,len=strlen(name);    for(int i=0;i<len;i++)    {        b=name[i]-'a';        if(!trie[a].son[b])        {            trie[a].son[b]=++num;        }        a=trie[a].son[b];    }    trie[a].have=1;}int search(char name[]){    int a=0,b,len=strlen(name);    for(int i=0;i<len;i++)    {        b=name[i]-'a';        if(!trie[a].son[b])        {            return 3;        }        a=trie[a].son[b];    }    if(!trie[a].have)    {        return 3;    }    if(!trie[a].cot)    {        trie[a].cot=1;        return 1;    }    return 2;}int main(){    char name[55];    int n1;    scanf("%d",&n1);    for(int i=1;i<=n1;i++)    {        scanf("%s",name);        in(name);    }    scanf("%d",&n1);    for(int i=1;i<=n1;i++)    {        scanf("%s",name);        int p=search(name);        if(p==1)        {            printf("OK\n");            continue;        }        if(p==2)        {            printf("REPEAT\n");            continue;        }        printf("WRONG\n");    }    return 0;}
原创粉丝点击