[算法] 字符串的简单模式匹配

来源:互联网 发布:coach淘宝代购 编辑:程序博客网 时间:2024/06/03 19:17
在串T中查找是否有与串P相等的子串,则称串T为目标(Target),把P称为模式(Pattern)。

称查找模式在目标中的匹配位置的运算为模式匹配(Pattern matching)。

简单模式匹配算法
BF算法 (又称古典的、经典的、朴素的、穷举的)
带回溯,速度慢

算法思想

将主串T的第pos个字符和模式P的第1个字符比较,
若相等,继续逐个比较后续字符;
若不等,从主串T的下一字符(pos+1)起,重新与P第一个字符比较。

直到主串T的一个连续子串字符序列与模式P相等。返回值为T中与P匹配的子序列第一个字符的序号,即匹配成功。

否则,匹配失败,返回值 -1。代码如下:

 1 int NaiveStrMatching(string T, string P) 2 { 3     int i = 0, j = 0; 4     int plen = P.length(); 5     int tlen = T.length(); 6     if(tlen < plen) return -1; 7     while(i < tlen && j < plen) 8     { 9         if(T[i] == P[j])10         {11             i ++;12             j ++;13         }14         else15         {16             i = i - j + 1;            //下一趟比较17             j = 0;18         }19     }20     if(j >= plen) return  i - j;    //匹配成功21     else  return -1;22 }

算法分析:

设目标T的长度为n,模式P 的长度为m,在最坏情况下,比较次数:(n-m+1)*m

在多数情况下,m远小于n, 因此算法的最坏的时间复杂性为O(n*m)。
复杂度高,效率低