字符串相似度(距离)
来源:互联网 发布:linux怎么解压war包 编辑:程序博客网 时间:2024/05/01 20:38
编程之美上有一道这样的题目:
许多程序会大量使用字符串。对于不同的字符串,我们希望能够有办法判断其相似程度。我们定义了一套操作方法来把两个不相同的字符串变得相同,具体的操作方法为:
1.修改一个字符(如把“a”替换为“b”)。
2.增加一个字符(如把“abdd”变为“aebdd”)。
3.删除一个字符(如把“travelling”变为“traveling”)。
比如,对于“abcdefg”和“abcdef”两个字符串来说,我们认为可以通过增加/减少一个“g“的方式来达到目的。上面的两种方案,都仅需要一次操作。把这个操作所需要的次数定义为两个字符串的距离,给定任意两个字符串,你是否能写出一个算法来计算出它们的距离?
这道题主要在于求出 最小两个字符串的距离最小值。而动态规划可以用于求最优值。
令f[i][j] 表示字符串a的前i个字符与字符串b前j个字符的距离最小值。
如果 a[i]=b[j] 则两个字符串不用任何操作,f[i][j]=f[i-1][j-1];
如果a[i]!=b[j],则此时这两个字符串,其中一个字符串或者删除个字符,或者添加一个字符,或者修改一个字符,总而言之需要一次操作。而且添加与删除是等效的, 可等价其中一个字符串少了一个字符,只考虑a的前i-1个或b的前j-1个;而修改意味着,这两个字符串同时删除了一个字符,考虑a的前i-1个和b的j-1个字符。
综上所述,转移方程为:
if a[i]=a[j]
f[i][j]=f[i-1][j-1];
else
f[i][j]=min{ f[i-1][j],f[i][j-1],f[i-1][j-1]}+1;
f[0][j]=j; // 一个0长度字符串与1个长度为j的字符串的距离当然为j
f[i][0]=i; // 同上
使用动态规划方法的代码:时间复杂度O(n1*n2),空间复杂度0(n1*n2);
int main(){char s1[100]="a";char s2[100];while(s1[0]!='#'){cin>>s1;cin>>s2;int n1=strlen(s1);int n2=strlen(s2);cout<<n1<<n2<<endl;cout<<"similarity degree="<<f(s1,0,n1,s2,0,n2)<<endl;int f[101][101];int i,j;for(i=0;i<=100;i++)f[0][i]=i;for(j=0;j<=100;j++)f[j][0]=j;for(i=1;i<=n1;i++){for(j=1;j<=n2;j++){if(s1[i-1]==s2[j-1])f[i][j]=f[i-1][j-1];else{int t=min(f[i-1][j],(min(f[i][j-1],f[i-1][j-1])));f[i][j]=1+t;}}}cout<<"distance="<<f[n1][n2]<<endl;}return 0;}
int main(){char s1[100]="a";char s2[100];while(s1[0]!='#'){cin>>s1;cin>>s2;int n1=strlen(s1);int n2=strlen(s2);int i,j;//选择min(n1,n2)长度作为一维数组的的长度,假设此时n2<n1int last=0;int dp[101];for(i=0;i<=n2;i++)dp[i]=i;for(i=1;i<=n1;i++){last=dp[0];dp[0]=i;for(j=1;j<=n2;j++){if(s1[i-1]==s2[j-1]){int tmp=last;last=dp[j];dp[j]=tmp;}else{int t=min(dp[j],min(dp[j-1],last));last=dp[j];dp[j]=1+t;}}}cout<<"dis="<<dp[n2];}return 0;}
递归方法为:时间复杂度O(n^3)
int f(char *s1,int i1,int n1,char *s2,int i2,int n2){while((i1<n1) && (i2<n2) && (s1[i1]==s2[i2])){i1++;i2++;}if((i1==n1) || (i2==n2)){if(n1>i1)return n1-i1;else if(n2>i2)return n2-i2;elsereturn 0;}else{int m=min(f(s1,i1,n1,s2,i2+1,n2),f(s1,i1+1,n1,s2,i2,n2));m=min(m,f(s1,i1+1,n1,s2,i2+1,n2));return m+1;}}int main(){char s1[100]="a";char s2[100];while(s1[0]!='#'){cin>>s1;cin>>s2;int n1=strlen(s1);int n2=strlen(s2);cout<<n1<<n2<<endl;cout<<"similarity degree="<<f(s1,0,n1,s2,0,n2)<<endl;}return 0;}
- 字符串相似度(距离)
- 字符串距离-相似度
- 计算两个字符串的距离(相似度)
- 计算字符串的相似度---编辑距离
- 编辑距离 字符串相似度问题
- 字符串相似度对比(距离法)
- 字符串编辑距离相似度-动态规划
- 字符串相似度(编辑距离)
- 最小编辑距离(字符串相似度)
- 字符串编辑距离(相似度)
- 相似URL判定及字符串相似度距离
- 【学习笔记】字符串编辑距离(字符串相似度)
- 20170828_字符串编辑距离_字符串相似度_DP
- 字符串相似度算法 levenshtein distance 编辑距离算法
- java实现编辑距离算法,计算字符串相似度
- 求两个字符串的相似度(或距离)
- 计算字符串的相似度(编辑距离)
- 字符串相似度算法(编辑距离算法 Levenshtein Distance)
- 云计算之路
- 【转】android开发中实现个性化ListView的一些概念和思路
- Slave_SQL_Running: No mysql同步故障解决方法
- Windows Socket编程之HelloWorld
- hdu 4607——Park Visit(暑假第一次多校)
- 字符串相似度(距离)
- 4.7 Proxy代理模式
- 7月24日
- spring+hibernate架构中Dao访问数据库的几种方法
- 程序员技术练级攻略
- linkflags += -Wl
- thread
- HDU2491 贪心
- How can I capture raw 802.11 frames, including non-data (management, beacon) frames?