互联网面试之最长公共字串LCS

来源:互联网 发布:安防监控光纤网络系统 编辑:程序博客网 时间:2024/06/05 16:09

子字符串的定义和子序列的定义类似,但要求是连续分布在其他字符串中。比如输入两个字符串:

str1="shaohuizabd"

str2="ahuixabc"

公共字串有hui和ab,但最长是hui,长度3

思路:

将字符串s1和s2分别写在两把直尺上面(我依然用s1,s2来表示这两把直尺),然后将s1固定,s2的头部和s1的尾部对齐,然后逐渐移动直尺s2,比较重叠部分的字符串中的公共子串的长度,直到直尺s2移动到s1的头部。在这个过程中求得的最大长度就是s1、s2最大子串的长度。

     下图是求解过程的图示(下图有点错误,应该是将s2从右往左移动),蓝色部分表示重叠的字符串,红色的部分表示重叠部分相同的子串

      其中s1="shaohui",s2="ahui",最后求得的结果为3

可以看到一共比较了len1+len2次,故问题关键是找到两个字符串匹配比较时各自下标与比较次数的关系:

s1_start=i-len1-1 when i<len1,此时str1字符串还没有完全进入str2,str2参与比较永远都是从s2的开始位开始故s2_start=0;

当str1完全进入str2时,此时i>=len1:

s2_start=i-len1+1,此时s1永远都是从0开始,s1_start=0。

代码:

int longest_common_string(string str1,string str2){int i;int len1=str1.size();int len2=str2.size();int s1_s,s2_s;int curmax;int max=0;int len=len1+len2;int idx;string str="";string res="";for(i=0;i<len;i++){    s1_s=s2_s=0;    if(i<len1){s1_s=len1-i-1;//匹配的s1下标              }//s1从外移动    else{s2_s=i-len1+1;        }    curmax=0;    for(idx=0;(s1_s+idx<len1)&&(s2_s+idx<len2);idx++)if(str1[s1_s+idx]==str2[s2_s+idx]){str+=str1[s1_s+idx];curmax++;}    else{    if(curmax>max){max=curmax;res=str;}    curmax=0;    str="";    }    if(curmax>max){max=curmax;res=str;}                   }cout<<res<<endl;return max;}


原创粉丝点击