C++实现字符串匹配的KMP算法

来源:互联网 发布:江西填湖广知乎 编辑:程序博客网 时间:2024/06/06 04:18

     之前看《算法导论》字符串匹配部分讲到KMP算法,被弄得云里雾里。今天看到阮一峰写了一篇博客《字符串匹配的KMP算法》[1~2],讲的浅显易懂,便按照他的思路用C++实现了一篇,代码如下:

#include <iostream>#include <string>using namespace std;//计算单次的部分匹配值,如str=="ABCDAB"时返回2int single_match(string str){int match_num=0;int n=str.length();string prefix,suffix;for(int i=0;i!=n-1;++i){prefix=str.substr(0,i+1);suffix=str.substr(n-1-i);if(prefix==suffix)match_num+=prefix.length();}return match_num;}//对整个字符串,计算其部分匹配表void partial_match_table(string str,int* table){int n=str.length();for(int i=0;i!=n;++i){string sub_str=str.substr(0,i+1);int temp=single_match(sub_str);table[i]=temp;}}// KMP算法int Knuth_Morris_Pratt(string str1,string str2,int *table){int n1=str1.length();int n2=str2.length();int i=0;while(i<n1-n2){int j=0;while(j<n2){if(str1[i+j]==str2[j])++j;elsebreak;}if(j==n2)break;else if(j==0)++i;else    i+=j-table[j-1];}if(i>n1-n2)return -1;return i;}int main(){string str1("BBC ABCDAB ABCDABCDABDE");string str2("ABCDABD");//cout<<single_match("ABCDAB")<<endl;int n=str2.length();int *table=new int[n];partial_match_table(str2,table);for(int i=0;i<n;++i)cout<<table[i]<<' ';cout<<endl;cout<<Knuth_Morris_Pratt(str1,str2,table)<<endl;return 0;}


代码的缺点是对字符串的处理太过生硬。习惯了python对string类型的切片操作后,对C++中string类型的使用太生疏,以至于取出子串的操作都用遍历相加来实现……

欢迎大家提出修改意见哈~


KMP算法:

[1] http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html

[2] http://blog.jobbole.com/39066/

Boyer-Moore算法:

[3] http://www.ruanyifeng.com/blog/2013/05/boyer-moore_string_search_algorithm.html

[4] http://blog.jobbole.com/39132/