hdu 2896 (AC自动机)

来源:互联网 发布:天干地支算法 编辑:程序博客网 时间:2024/05/29 07:38

D - 病毒侵袭
Time Limit:1000MS     Memory Limit:32768KB     64bit IO Format:%I64d & %I64u
Submit Status

Description

当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋――我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~ 
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。 
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~ 
 

Input

第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。 
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20―200之间。 
每个病毒都有一个编号,依此为1―N。 
不同编号的病毒特征码不会相同。 
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。 
接下来M行,每行表示一个网站源码,源码字符串长度在7000―10000之间。 
每个网站都有一个编号,依此为1―M。 
以上字符串中字符都是ASCII码可见字符(不包括回车)。 
 

Output

依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。 
web 网站编号: 病毒编号 病毒编号 … 
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。 
最后一行输出统计信息,如下格式 
total: 带病毒网站数 
冒号后有一个空格。 
 

Sample Input

3aaabbbccc2aaabbbcccbbaacc
 

Sample Output

web 1: 1 2 3total: 1
 



题解:这里递归打印不好处理,使用一个数组记录下路径就好了,说一下这一题的坑点,

1:病毒编号按从小到大排,又说:如果一个网站包含病毒,病毒数不会超过3个。 那么我猜重复出现的病毒是不需要输出的,那么最好是使用set判断重复而且自动排序

2.输入的是可见字符,那么数组直接开128就可以啦!开26会出现越界哒



#include<cstdio>  #include<cstring>  #include<cstdlib>  #include<cmath>  #include<iostream>  #include<algorithm>  #include<vector>  #include<map>  #include<set>  #include<queue>  #include<string>  #include<bitset>  #include<utility>  #include<functional>  #include<iomanip>  #include<sstream>  #include<ctime>  using namespace std;  #define N int(1e5+10)  typedef long long LL; const int SIGMA_SIZE = 129;  const int MAXNODE = (505*205);  const int MAXS =10005;  map<string,int> ms;  int ch[MAXNODE][SIGMA_SIZE];  int f[MAXNODE];    // fail函数  int val[MAXNODE];  // 每个字符串的结尾结点都有一个非0的val  int last[MAXNODE]; // 输出链表的下一个结点    set<int>egoist;//ms是为了满足特殊要求,比如模板串相同时  struct ACautomata {     int sz;    void init() {      sz = 1;      memset(ch[0], 0, sizeof(ch[0]));      ms.clear();    }      // 字符c的编号    int idx(char c) {      return int(c);    }      // 插入字符串。v必须非0    void insert(char *s, int v) {      int u = 0, n = strlen(s);      for(int i = 0; i < n; i++) {        int c = idx(s[i]);        if(!ch[u][c]) {          memset(ch[sz], 0, sizeof(ch[sz]));          val[sz] = 0;          ch[u][c] = sz++;        }        u = ch[u][c];      }      val[u] = v;      ms[string(s)] = v;    }      // 递归打印匹配文本串str[i]结尾的后缀,以结点j结尾的所有字符串    void print(int i,int j) {      if(j) {  egoist.insert(val[j]);      print(i,last[j]);      }    }      // 在T中找模板    void find(char* T) {      int n = strlen(T);      int j = 0; // 当前结点编号,初始为根结点      for(int i = 0; i < n; i++) { // 文本串当前指针        int c = idx(T[i]);        j = ch[j][c];        if(val[j])  { print(i,j);   }      else if(last[j])   {print(i,last[j]);   }// 找到了!      }    }      // 计算fail函数    void getFail() {      queue<int> q;      f[0] = 0;      // 初始化队列      for(int c = 0; c < SIGMA_SIZE; c++) {        int u = ch[0][c];        if(u) { f[u] = 0; q.push(u); last[u] = 0; }      }      // 按BFS顺序计算fail      while(!q.empty()) {        int r = q.front(); q.pop();        for(int c = 0; c < SIGMA_SIZE; c++) {          int u = ch[r][c];          if(!u) {              ch[r][c]=ch[f[r]][c];              continue;          }          q.push(u);          int v = f[r];          while(v && !ch[v][c]) v = f[v];          f[u] = ch[v][c];          last[u] = val[f[u]] ? f[u] : last[f[u]];        }      }    }    }AC;  char s[N];char tmp[505][205];int main()  {  #ifdef CDZSC      freopen("i.txt", "r", stdin);    #endif  int n,m;while(~scanf("%d",&n)){AC.init();for(int i=1;i<=n;i++){scanf("%s",tmp[i]);AC.insert(tmp[i],i);}int total=0;AC.getFail();scanf("%d",&m);for(int i=1;i<=m;i++){egoist.clear();scanf("%s",s);AC.find(s);if(egoist.size()>0){total++;printf("web %d:",i);for(set<int>::iterator k=egoist.begin();k!=egoist.end();k++){printf(" %d",*k);}printf("\n");}}printf("total: %d\n",total);}    return 0;  }  







0 0
原创粉丝点击