hdu 3065 病毒侵袭持续中(ac自动机)

来源:互联网 发布:淘宝美工网站 编辑:程序博客网 时间:2024/06/05 04:30

Description

小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?
 

Input

第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。 
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1―50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。 
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。 
 

Output

按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。 
病毒特征码: 出现次数 
冒号后有一个空格,按病毒特征码的输入顺序进行输出。 
 

Sample Input

3AABBCCooxxCC%dAAAoen....END
 

Sample Output

AA: 2CC: 1

Hint

 Hit: 题目描述中没有被提及的所有情况都应该进行考虑。比如两个病毒特征码可能有相互包含或者有重叠的特征码段。 计数策略也可一定程度上从Sample中推测。


注意字符串范围只为大写字母!另外每次匹配失败后要从根节点重新匹配!

#include <iostream>#include <algorithm>#include <stdio.h>#include <string.h>#include <string>using namespace std;#define kind 26#define N 1005#define M 2000005int head, tail;char keyword[N][55],str[M];int k[N];struct node{    node *fail;    node *next[kind];    int id,count;    node() //init    {        fail = NULL;        count=0;        id=0;        for(int i = 0; i <kind; ++i)            next[i] = NULL;    }}*q[500000];node *root;void insert(char *str,int num) //建立Trie{    int temp, len;    node *p = root;    len = strlen(str);    for(int i = 0; i < len; ++i)    {        temp = str[i] - 'A';//注意:字符串只包含“英文大写字符”        if(p->next[temp] == NULL)            p->next[temp] = new node();        p = p->next[temp];    }    p->id=num;    p->count++;}void build_ac() //初始化fail指针,BFS{    q[tail++] = root;    while(head != tail)    {        node *p = q[head++]; //弹出队头        node *temp = NULL;        for(int i = 0; i < kind; ++i)        {            if(p->next[i] != NULL)            {                if(p == root) //第一个元素fail必指向根                    p->next[i]->fail = root;                else                {                    temp = p->fail; //失败指针                    while(temp != NULL) //2种情况结束:匹配为空or找到匹配                    {                        if(temp->next[i] != NULL) //找到匹配                        {                            p->next[i]->fail = temp->next[i];                            break;                        }                        temp = temp->fail;                    }                    if(temp == NULL) //为空则从头匹配                        p->next[i]->fail = root;                }                q[tail++] = p->next[i]; //入队            }        }    }}void query(char *str) //扫描{    int index,len;    node *p = root; //Tire入口    len = strlen(str);    for(int i = 0; i < len; ++i)    {        if(str[i]>='A'&&str[i]<='Z')        {            index = str[i]-'A';//注意:字符串只包含“英文大写字符”            while(p->next[index] == NULL && p != root) //跳转失败指针                p = p->fail;            p = p->next[index];            if(p == NULL)                p = root;            node *temp = p; //p不动,temp计算后缀串            while(temp != root&&temp->count>0)            {                k[temp->id]++;                temp = temp->fail;            }        }        else p=root;//不满足则从头开始!!    }}int main(){    int n;    while(scanf("%d",&n)!=EOF)    {        head= tail = 0;        root = new node();        memset(k,0,sizeof(k));        for(int i=1; i<=n; i++)        {            scanf("%s",keyword[i]);            insert(keyword[i],i);        }        build_ac();        scanf("%s", str);        query(str);        for(int i=1; i<=n; i++)        {            if(k[i]>0)                printf("%s: %d\n",keyword[i],k[i]);        }    }    return 0;}


0 0
原创粉丝点击