POJ 3294 后缀数组+二分

来源:互联网 发布:lg刻录机软件 编辑:程序博客网 时间:2024/05/16 19:09
你可能想知道为什么大多数外星生命形式类似于人类,不同的表面特征,如身高,颜色,皱纹,耳朵,眉毛等。几个人没有人类的相似性;这些通常具有几何或无定形形状,如立方体,油滑层或尘云。
答案是在星际迷航 - 下一代的第146集,题为追逐。事实证明,在绝大多数象限的生命形式最终与一个大片段的共同的DNA。
给定被表示为字母串的几个生命形式的DNA序列,您将找到由其中一半以上共享的最长子字符串。
输入
标准输入包含几个测试用例。每个测试用例开始于1≤n≤100,即生命形式的数量。 n行;每个包含代表生命形式的DNA序列的小写字母的字符串。每个DNA序列包含至少一个且不超过1000个字母。在最后一个测试用例之后包含0的行。
输出

对于每个测试用例,输出由一半以上生命形式共享的最长字符串。如果有很多,按字母顺序输出所有。如果没有至少有一个字母的解,输出“?”。在测试用例之间留下空行。

点击打开链接

题意:先是问你大于n/2个串的最长公共子串的长度,然后在这个长度的基础上,有多少子串是符合的,按字典序输出

思路:先将最长公共子串的长度求出来,然后再跑一遍,将长度符合的找出来输出就行了,PS:昨天晚上调了几个小时的bug,妹的根本就不需要自己排序,用后缀数组先符合的肯定是字典序最小的嘛,蠢死的节奏,还有就是对于每一组的前缀我们只要第一个,这个也只需要标记一下即可,后者想不到的话,我们可以在输出的时候去一下重,应该也可以还没有尝试,还有就是这道题目的相连的串之间添加的字符不能一样,不然可能会是因为添加的字符变成的最长公共子串,会影响结果

[html] view plain copy
 在CODE上查看代码片派生到我的代码片
  1. #include <vector>  
  2. #include <stdio.h>  
  3. #include <stdlib.h>  
  4. #include <string.h>  
  5. #include <iostream>  
  6. #include <algorithm>  
  7. using namespace std;  
  8. typedef long long ll;  
  9. const int inf=0x3f3f3f3f;  
  10. const int MAXN=110000;  
  11. int wa[MAXN],wb[MAXN],wv[MAXN],ww[MAXN];  
  12. int sa[MAXN],lcp[MAXN],Rank[MAXN],rank1[MAXN];  
  13. int str1[MAXN];  
  14. inline bool cmp(int *r,int a,int b,int len){  
  15.     return r[a]==r[b]&&r[a+len]==r[b+len];  
  16. }  
  17. void construct_sa(int *str,int n,int m){  
  18.      int i,j,p,*x=wa,*y=wb,*t;  
  19.      for(i=0;i<m;i++) ww[i]=0;  
  20.      for(i=0;i<n;i++) ww[x[i]=str[i]]++;  
  21.      for(i=1;i<m;i++) ww[i]+=ww[i-1];  
  22.      for(i=n-1;i>=0;i--) sa[--ww[x[i]]]=i;  
  23.      for(j=p=1;p<n;j<<=1,m=p){  
  24.          for(p=0,i=n-j;i<n;i++)  
  25.             y[p++]=i;  
  26.          for(i=0;i<n;i++){  
  27.              if(sa[i]>=j)  
  28.                  y[p++]=sa[i]-j;  
  29.          }  
  30.          for(i=0;i<m;i++) ww[i]=0;  
  31.          for(i=0;i<n;i++) ww[wv[i]=x[y[i]]]++;  
  32.          for(i=1;i<m;i++) ww[i]+=ww[i-1];  
  33.          for(i=n-1;i>=0;i--) sa[--ww[wv[i]]]=y[i];  
  34.          for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1;i<n;i++)  
  35.              x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;  
  36.      }  
  37. }  
  38. void construct_lcp(int n,int *str){  
  39.     for(int i=0;i<=n;i++) rank1[sa[i]]=i;  
  40.     int h=0;  
  41.     lcp[0]=0;  
  42.     for(int i=0;i<n;i++){  
  43.         int j=sa[rank1[i]-1];  
  44.         if(h>0) h--;  
  45.         for(;j+h<n&&i+h<n;h++) if(str[i+h]!=str[j+h]) break;  
  46.         lcp[rank1[i]-1]=h;  
  47.     }  
  48. }  
  49. int id[MAXN];  
  50. vector<int>G;  
  51. bool vis[1010];  
  52. char str2[1010];  
  53. int judge(int mid,int k,int n){  
  54.     memset(vis,0,sizeof(vis));  
  55.     int sum=0;  
  56.     for(int i=0;i<k;i++){  
  57.         if(lcp[i]<mid){  
  58.             if(sum==0) continue;  
  59.             memset(vis,0,sizeof(vis));sum=0;  
  60.             continue;  
  61.         }  
  62.         if(vis[id[sa[i]]]==0){  
  63.             vis[id[sa[i]]]=1;  
  64.             sum++;  
  65.         }  
  66.         if(vis[id[sa[i+1]]]==0){  
  67.             vis[id[sa[i+1]]]=1;  
  68.             sum++;  
  69.         }  
  70.         if(sum>n/2) return 1;  
  71.     }  
  72.     return 0;  
  73. }  
  74. void slove(int mid,int k,int n){  
  75.     memset(vis,0,sizeof(vis));  
  76.     int sum=0,cnt=0,flag=0;  
  77.     for(int i=0;i<k;i++){  
  78.         if(lcp[i]<mid){  
  79.             memset(vis,0,sizeof(vis));sum=0;flag=0;  
  80.             continue;  
  81.         }  
  82.         if(vis[id[sa[i]]]==0){  
  83.             vis[id[sa[i]]]=1;  
  84.             sum++;  
  85.         }  
  86.         if(vis[id[sa[i+1]]]==0){  
  87.             vis[id[sa[i+1]]]=1;  
  88.             sum++;  
  89.         }  
  90.         if(sum>n/2&&flag==0){  
  91.             G.push_back(sa[i]);  
  92.             cnt++;flag=1;  
  93.         }  
  94.     }  
  95.     for(int i=0;i<mid;i++) printf("%c",str1[G[0]+i]);  
  96.     printf("\n");  
  97.     for(int i=1;i<cnt;i++){  
  98.         if(G[i]==G[i-1]) continue;  
  99.         for(int j=0;j<mid;j++) printf("%c",str1[G[i]+j]);  
  100.         printf("\n");  
  101.     }  
  102. }  
  103. int main(){  
  104.     int n;  
  105.     while(scanf("%d",&n)!=-1){  
  106.         if(n==0) break;  
  107.         int k=0;G.clear();  
  108.         memset(str1,0,sizeof(str1));  
  109.         memset(id,-1,sizeof(id));  
  110.         for(int i=0;i<n;i++){  
  111.             scanf("%s",str2);  
  112.             int len=strlen(str2);  
  113.             for(int j=0;j<len;j++){  
  114.                 str1[k]=str2[j];  
  115.                 id[k++]=i;  
  116.             }  
  117.             if(i!=n-1) str1[k++]=150+i;  
  118.         }  
  119.         construct_sa(str1,k+1,1010);  
  120.         construct_lcp(k,str1);  
  121.         int le=0,ri=1010;  
  122.         while(ri-le>1){  
  123.             int mid=(le+ri)>>1;  
  124.             if(judge(mid,k,n)) le=mid;  
  125.             else ri=mid;  
  126.         }  
  127.         if(le==0) printf("?\n");  
  128.         else slove(le,k,n);  
  129.         printf("\n");  
  130.     }  
  131.     return 0;  
  132. }  

0 0
原创粉丝点击