POJ3691 - AC自动机的第一道DP

来源:互联网 发布:mac设置铃声教程 编辑:程序博客网 时间:2024/05/16 12:21

    第一道AC自动机...从上周日就开始写了..搞得我都要抓狂了...今天也是看了在网上搜了些解题报告才搞定...发现和我自己整得差别较大...瞎忙活了3天...

   .题意是说给了N个带病毒的DNA串( DNA串只有AGCT几种单元组成)...再给一长串DNA..问这长串DNA最少改动几个(就是改..不是删除或者添加..)能保证没有包含病毒字串..输出这个最小改动的次数..若怎么修改都带病毒子串...输出-1...

    所谓dp就是要构造一个无后效性的状态...并能从前往后推出所要的最优解....

    我参考了http://blog.csdn.net/human_ck/article/details/6577142的思路...很清晰...代码也简洁...

    我也来说明几个问题..

    问题一:为什么当一个节点是病毒节点(某个病毒串的末位)..要逆向随着Fail.要往下传...

    如果前面有一段是病毒...指向末位的下面那个点和他几个Father连起来的必定也是这段病毒..

    问题二:为什么在构造Fail指针时若其某个孩子没有要指向其Father->Fail的相同孩子...

    其实这相当于是往上传~~一直往上Fail传直到找到上面某个的孩子中有这个...若这样到根都没有..那么这个点就直接指向根了...指向根代表当前这课Trie中没有符合的..这样的好处就是虽然构造的Trie中没有这个点...也没有给这个点分配空间...但是...我们给了这个点一个标记的类似...使得后面的DP中找不到时能直接向上返回...如果不这么搞也行..就要在DP中多加些东西.. 例如 

                                         1

                                          AAA

                                         GGG

这组数据可以说在后面通过遍历Trie做DP时一个点都进不去...如果前面加了关于Trie中没得该点的预处理...那么实际上就利用起来了那个没带字符信息的超级结点.....

    


Program:

//POJ 3691 - AC自动机DP初步 #include<iostream>#include<queue>using namespace std;struct node{     int s[4],fail;     bool word;   }a[1001];int t,n,len,g,dp[1011][1011];char s[1011]; queue<int> myqueue;int turn(char c){    if (c=='A') return 0;    if (c=='G') return 1;    if (c=='C') return 2;    if (c=='T') return 3;        }void Built_Trie(int h,int k){    int p;     if (k==len)    {        a[h].word=true;                 return;    }     p=turn(s[k]);    if (!a[h].s[p])    {        g++;        a[h].s[p]=g;                       }    Built_Trie(a[h].s[p],k+1);}int UpdataFail(int h,int g){    if (a[h].s[g]) return a[h].s[g];    else     if (!h) return h;    else return UpdataFail(a[h].fail,g);   }void Built_AC_Automation(){    int h,i;       while (!myqueue.empty()) myqueue.pop();     myqueue.push(0);       while (!myqueue.empty())    {          h=myqueue.front();           myqueue.pop();          for (i=0;i<4;i++)           if (a[h].s[i])          {                myqueue.push(a[h].s[i]);                  if (h) a[a[h].s[i]].fail=UpdataFail(a[h].fail,i);                  if (a[a[a[h].s[i]].fail].word) a[a[h].s[i]].word=true;  //!!!                 }else            if (h) a[h].s[i]=a[a[h].fail].s[i];             }    return;}int GetAnswer(){    int i,j,w,k,x,ans;     memset(dp,0x7F,sizeof(dp));     dp[0][0]=0;      for (int p=0;p<len;p++)    {         w=turn(s[p]);         for (j=0;j<=g;j++)            if (dp[j][p]<=1000)              for (i=0;i<4;i++)                 if (!a[a[j].s[i]].word)                 {                        k=a[j].s[i];                          if (i==w) x=dp[j][p]; else x=dp[j][p]+1;                        if (dp[k][p+1]>x) dp[k][p+1]=x;                                         }     }     ans=1001;    for (i=0;i<=g;i++)        if (dp[i][len]<ans) ans=dp[i][len];    if (ans>1000) return -1;     else return ans;}int main(){     t=0;    while (~scanf("%d",&n))    {         if (!n) break;          getchar();         memset(a,0,sizeof(a));         g=0;         while (n--)         {             scanf("%s",s);             len=strlen(s);              Built_Trie(0,0);         }           Built_AC_Automation();         scanf("%s",s);         len=strlen(s);                 printf("Case %d: %d\n",++t,GetAnswer());    }    return 0;   }