程序设计实习2015年期末考试 E.DNA(状态压缩dp+特殊处理+预处理)

来源:互联网 发布:js音乐播放器进度条 编辑:程序博客网 时间:2024/06/08 09:01

程序设计实习2015年期末考试 E.DNA(状态压缩+特殊处理+预处理)
总时间限制: 6000ms 内存限制: 1024kB

描述
考虑一段DNA单链,上面有N个基因片段。这里的基因片段可重叠(例如AGCTC包含AGC和CTC),不可倒置(例如AGCTC不包含TCG)。要问这样的单链最短长度是多少。

输入
输入的第一行是一个正整数T(不超过13),表示数据组数。每组数据若干行,其中第一行一个正整数N(不超过9),表示基因片段的数目,接下来N行每行一个基因片段,由AGCT四个字母组成,且长度介于1和15之间(含两端)。

输出
每组数据输出一样,表示最短的单链长度包含这N个基因片段。

样例输入

1
5
TCGG
GCAG
CCGC
GATC
ATCG

样例输出

11


这个题一看到就想到状态压缩dp,但是光组成状态这一个维度是不够的,因为同一个状态由于排列不同添加一个DNA片段代价不一样,所以我第一反应添加了另外一个维度——结尾的字符串。但是WA,当时想到一个问题,万一最后一个DNA片段长得一个片段解决不了要多个呢,那么这个状态压缩岂不是得改成dfs了,心凉了半截,改为dfs,TLE。陷入了死胡同。
其实,我之所以状态压缩也许只是我觉得似乎是状态压缩,并没有自己的思考,我连上一个问题都没想明白就开始写,就算对了也是瞎蒙的。痛定思痛想了想,想明白了这个问题:
如果在ABC这个串后面加了一个D,D在BC内是一个子片段,虽然算不出正确结果,但是由于必然计算过AB+D+C=ABC这一形式的状态压缩dp局部解,所以ABC+D这个错误解答不会影响。但是,如果D是C的一个子片段,那么问题就很产生了,为了避免这个错误,要特殊处理,读入一个片段后判断是否被前面的串包含,包含则删去,这样算法才具有了正确性。
特殊处理后本题算法就有了正确性保证,预处理dis[i][j]表示i后接上j可以重叠长度。一个小技巧,合理调用< string.h>内的库函数strstr()可以节省查找子串代码量,性能也不差。

Accepted    260kB   0ms 1527 B  G++
#define MAX_N 9#define MAX_LEN 15#define INF MAX_N*MAX_LEN#include<stdio.h>#include<memory.h>#include<string.h>int cases,n,ans;char s[MAX_N][MAX_LEN+1];int l[MAX_N];int dp[1<<MAX_N][MAX_N];//状态/结尾 int common[MAX_N][MAX_N],c;bool ok;int f(int state,int i){    //printf("%d %d\n",state,i);     if (dp[state][i])        return dp[state][i];    dp[state][i]=INF;    for (int j=0;j<n;j++)        if (i!=j && ((state&(1<<j))!=0))            if (f(state^(1<<j),j)+l[i]-common[j][i]<dp[state][i])                dp[state][i]=f(state^(1<<j),j)+l[i]-common[j][i];    return dp[state][i];}int main(){    //freopen("input.txt","r",stdin);     scanf("%d\n",&cases);    while (cases--)    {        memset(dp,0,sizeof(dp));        memset(s,0,sizeof(s));        scanf("%d\n",&n);        for (int i=0;i<n;i++)        {            scanf("%s\n",&s[i][0]);            for (int j=0;j<i;j++)                if (strstr(s[j],s[i])!=NULL)                    {                        i--;                        n--;                        break;                    }        }        for (int i=0;i<n;i++)            dp[0][i]=l[i]=strlen(s[i]);        for (int i=0;i<n;i++)            for (int j=0;j<n;j++)                if (i!=j)                {                    c=l[i]<l[j]?l[i]:l[j];                    ok=false;                    while (c)                    {                        if (strstr(s[j],s[i]+l[i]-c)==s[j])                            break;                        c--;                    }                    common[i][j]=c;                    //printf("%d %d:%d\n",i,j,common[i][j]);                }         ans=INF;         for (int i=0;i<n;i++)            if (f((1<<n)-(1<<i)-1,i)<ans)                ans=f((1<<n)-(1<<i)-1,i);        printf("%d\n",ans);    }    return 0;}
0 0
原创粉丝点击