KMP算法

来源:互联网 发布:见微数据 搜披露 编辑:程序博客网 时间:2024/06/16 13:52

以下内容转自

阮一峰的网络日志

KMP算法的关键之处在于计算 “部分匹配表“
例如:ABCDABD
计算部分匹配表的步骤如下:

  1. 明确前缀和后缀:
    ABCDABD的前缀有:A AB ABC ABCD ABCDA ABCDAB 不包括最后一个字符
    ABCDABD后缀:BCDABD CDABD DABD ABD BD D 不包括第一个字符
  2. 开始计算:
    部分匹配值就是前缀和后缀的 最长公共元素的长度
    —— “A” 的前缀和后缀都为空集,共有元素的长度为0;
    —— “AB”的前缀为 [A], 后缀为[B] ,公共元素的长度为 0;
    —— “ABC”的前缀为[A,AB], 后缀为[BC,C]公共元素长度为0;
    ——“ABCD”的前缀为[A,AB,ABC],后缀为[BCD,CD,D]公共元素长度为0;
    ——“ABCDA”的前缀为[A,AB,ABC,ABCD]后缀为[BCDA,CDA,DA,A]公共元素为A,长度为1;
    ——“ABCDAB”的前缀为[A,AB,ABC,ABCD,ABCDA]后缀为[BCDAB,CDAB,DAB,AB,B]公共元素为AB长度为2;
    ——“ABCDABD”的前缀为[A,AB,ABC,ABCD,ABCDA,ABCDAB]后缀为[BCDABD,CDABD,DABD,ABD,BD,D]公共元素为0;
最终部分匹配表: 字符 搜索词 : A B C D A B D 部分匹配值: 0 0 0 0 1 2 0

往右移动的字符数目=匹配的总字符数—部分匹配值

ABCDABCDABDE ABCDABD

例如上面两个字符串进行匹配:上面为主串,下面为子串,在这里在子串的最后一个字符发现不匹配,现在来算一下子串应该往右移动的数目:
已匹配的字符数目为:6 ,由于是到D处不匹配,所以要看D之前B的部分匹配值:2
移动的大小为:6-2=4

0 0