kmp算法
来源:互联网 发布:淘宝购买力人群统计 编辑:程序博客网 时间:2024/06/05 05:48
串的模式匹配:串的定位操作。
首先我们先介绍一些基本的模式匹配算法:
朴素的模式匹配算法.
假设我们需要在串S=“aasceaj”中搜索出串T=“aasd”的位置,我们需要用到一下算法的思想:
int index(String S,String T,int pos) //pos显示的是T在S后面的pos位置开始。{ int i=pos;int j=1;while(i<=S[0]&&j<=T[0]) //S[0]存储S的长度,同理可得Tif(S[I]==T[j]){++i;++j;}else{i=i-j+2;j=1;}if(j>T[0])return i-T[0];elsereturn 0;}这种方法很容易理解。但是效率不是很高。下面我们介绍一下朴素模式匹配的改良版KMP算法。
kmp模式匹配算法:
这个算法可以大大避免重复便利的情况,我们把它称之为克努特-莫里斯-普拉特算法,简称KMP算法。
这个算法的基本原理。首先我们先不讲代码,这样很难理解,我们还是从一些例子出发。
假设S=“abcdefgab”,T=“abcdex",如果说我们按照之前的算法,我们发现知道第六个字母,两个串才不相等,接下来,我们会让j=1,但是i=2开始继续比较,这样一直下去,但是加入我们细心会发现对于T来说,它的所有字符均不相等,但是与S串前几个又相等,那么我们这样做就是在做无用功。如图所示
根据以上的原理得到KMP算法的核心:避免没有必要的回溯,从而来提高匹配的效率。
从上面的介绍我们知道这种回溯与i没有关系,我们只要需要知道j的回溯规律就可以高效的完成匹配,j值的变化有串T中是否有重复相关。j值的多少取决于当前字符之前的前后缀的相似度。
我们将T串个位置的j值的变化定义为一个数组next,那么next的长度就是T的长度。
对于next我们有以下的定义;
下面我们举几个例子来说明next数组:
.
下面我们来学习next【j】的算法实现:
void get_next(String T,int *next){int i,j;i=1;j=0; next[1]=0;while(i<T[0]) //对于代码,要亲自找几个例子试一下,自己理解一下更好。比如说S=“aaabcace”,T=“aaabac”当实验到5的时候酒后发现其中的规律。我就不说了{if(j==0||T[i]==T[j]){++i;++j;next[i]=j;}elsej=next[j];}}
int Index_KMP(String s,String T,int pos){int i=pos;int j=1;int next[255];get_next(T,next);while(i<=S[0]&&j,+T[0]){if(j==0||S[i]==t[j]){++i;++j;}else{j=next[j];}}if(j>T[0])retuen i-T[0];elsereturn 0;}
算法的核心就是不需要向朴素磨碎机匹配算法一样要一步一步做,它可以根据next的值跳跃一定的距离来提高效率。
0 0
- KMP算法详解 【KMP】
- 【KMP】KMP算法模板
- KMP hihoCoder1015 KMP算法
- kmp算法
- KMP算法
- KMP算法
- KMP算法
- KMP算法
- KMP 算法
- kmp算法
- KMP算法
- kmp算法
- KMP算法
- KMP算法
- kmp算法
- kmp算法
- KMP算法
- KMP算法
- linux shell脚本基础-----3
- C语言之关键字
- android开发环境搭建
- android模拟器使用
- android手机拨号器实现
- kmp算法
- OpenCV基础篇之像素操作对比度调节
- android-为应用单元测试
- windows之socket编程示例
- JDBC常用连接写法(包括MySQL、Oracle、Sybase、SQLServer、DB2)
- 工作一个月后
- 在不改变大小的情况下,如何以最省内存的方式读取本地资源的图片
- NSString 从文件里面读取字符串
- DSP/BIOS使用之初窥门径——滴答时钟及烧写Flash