KMP算法及Next数组求解方法
来源:互联网 发布:忧伤说唱 网络歌手 编辑:程序博客网 时间:2024/05/18 04:11
KMP算法是大二第一学期数据结构课上学的,当时有点颓废,听课都是得过且差不多懂了就行,没有更深的去理解一些东西,所以导致我学数据结构这个基础课程学的不咋地,慢慢补喽嘿嘿。加油嘿嘿
什么叫做模式匹配呢?
模式匹配是:
给定两个串S="s1s2....sn"和T=“t1t2...tm",在主串S中寻找子串T的过程称为模式匹配(pattern matching),其中T称为模式。如果匹配成功,返回T在S中的位置,如果匹配失败,返回0.
这里举例是:
S=”ababcabc....",T="ababcaba..." (分别下标对应1,2,3,4,5,6...)
对于模式匹配算法有两种算法:
一、朴素的模式匹配算法(效率不好的,通常算法比较简单的,效率都不咋地吧)
二、改进的模式匹配算法--KMP算法(比较复杂但是时间要少很多哦)
对于朴素的模式匹配算法呢,大体算法如下:
即每次匹配失败的时候,i,j都要回溯。
比如:当S(8)!=T(8)时,朴素的模式匹配算法是这样的嘿嘿:
既然从s(1)开始的子串不能匹配,那就再从s(2)开始的子串看看能不能匹配成功呢,匹配不成功的话,就再从s(3)开始的子串看看能不能成功呢,依次这样回溯下去。当然是不能匹配成功的了,其实这里面有很多不必要的比较:
对于:ababcab|c
ababcab|a
当比较到下标为8时,前面的1--7已经比较了,假设i要回溯到小标为2,因为存在
S串中的babcab==T串中的babcab,而T串中的ababca!=T串中的 babcab
则S串中的babcab!=T串中的ababca
所以即使i回溯到是s(2),接下来的比较:S串中的babcab!=T串中的ababca 是需要比的
同理,S串中的abcab!=T串中的ababc ,S串中的bcab!=T串中的abab,
S串中的cab!=T串中的bab ,S串中的ab==T串中的ab(这里即使相等也没有比较了)
所以,可以使i不回溯,只使j滑动到某个位置,这里的是滑动到t(3)的位置啦。
因为模式串T对于我们来说是已知的,所以可以求出每个j(1---length)对应的K值。
假如当s(i)!=t(j)时,也就是此时匹配失败,则
s1...s(i-j+1).......s(i-1) | s(i) (其中下标的算法是:i-1-x=j-1-1,所以x=i-j+1)
t(1)............t(j-1) | t(j) (已经匹配的字符串的长度肯定是相等的嘛)
J-1长度的字符串是匹配相等的,则由
”s(i-j+1).......s(i-1)“==” t(1)............t(j-1)“ (这是以后算next[]数组的前提条件哦)
如果希望在某趟s(i)和t(j)的匹配失败后,指针i,不回溯,则使j移到k的位置,使得t(k)与s(i)继续匹配。
当j移到K的位置时:
s(1)....s(i-j+1)......s(i-k+1)............s(i-1)|s(1)
t(1)..................t(k-1)|t(k)
因为: ”s(i-j+1)...s(i-j+k-1)...s(i-k+1)...s(i-1)“==” t(1)...t(k-1)t(k)...t(j-k+1)......t(j-1)“
所以: ”s(i-k+1)...s(i-1)“==”t(j-k+1)......t(j-1)“
再因为:“t(1)........t(k-1) ”== "s(i-k+1).....s(i-1)"
再所以即: “t(1)........t(k-1) ”==”t(j-k+1)......t(j-1)“
即通过这个式子可以求出K的值。即:在模式串T中找到最大的一个重复子串(从t1开始到t(k)==从T(j-k+1)开始到T(j-1)的最长子串,找到了就是对应的K值。
下面是Next[]数组的函数:
0, j=1;
next[j]={ max {k|1<=K<j且“t(1)........t(k-1) ”==”t(j-k+1)......t(j-1)“
1 其他情况
那么下面是怎么在模式串中找到,这样的一个子串,就是:从t1开始到t(k)==从T(j-k+1)开始到T(j-1)的最长子串。
虽然现在对于求出next[]数组有了一定的认识,但是对于找到 这样的一个子串,就是:从t1开始到t(k)==从T(j-k+1)开始到T(j-1)的最长子串。还是需要算法的。
下面是求next数组的代码实现:
KMP算法用伪代码描述如下:
1.在串S和串T中,分别设比较的起始下标i,j;
2.循环直到S中所剩余字符长度小于T中的长度或者T中所有字符均比较完毕
2.1如果s[i]=s[j],继续比较s和T的下一个字符;否则
2.2将j向右滑动到next[j]的位置,即j=next[j];
2.3如果j=0,则将i和j分别加1,准备下一趟比较
3.如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回0;
- KMP算法及Next数组求解方法
- KMP算法,next数组求解
- KMP算法中的next数组求解
- python求解next数组实现KMP算法
- KMP算法及next数组
- 求解KMP算法及next值
- kmp next 数组代码 及 kmp 算法
- 【KMP】多种KMP算法next数组的求解
- C语言-字符串匹配-KMP算法及next数组求解和运用实例
- KMP算法中的next数组的两种算法求解
- 比较好懂的KMP算法解释(附next数组求解方法)
- KMP NEXT数组的求解
- KMP算法及next数组详解
- KMP算法中next和nextval数组的求解
- KMP算法——快速求解next数组
- 数据结构之模式匹配KMP算法的next数组求解
- 通俗讲解KMP算法和next数组求解
- KMP算法求next数组的方法
- 如何根据"需求及功能需要"去选择相关的"材料、型号、技术"的思考
- 技巧二则
- (转)研究 Port Layer
- web开发平台
- 编程珠玑开篇--磁盘文件排序问题
- KMP算法及Next数组求解方法
- Graphics Programming on linux using C--用c语言开发图形界面
- ON_UPDATE_COMMAND_UI
- 嵌入式系统 Boot Loader 技术内幕
- 国内外做单片机较有实力的公司
- HSplitScroll_应用
- Hibernate防止SQL注入攻击的方法
- c语言中time.h用法详解
- VC++动态/静态链接库 【4】