字符串匹配-Horpool算法

来源:互联网 发布:代办网络经营许可证 编辑:程序博客网 时间:2024/04/30 01:14

1、对BM算法进行简化的算法,对d3进行了一些小的修改。

2、对于每个搜索窗口,该算法将窗口内文本的最后一个字符和模式串的最后一个字符进行比较。如果相等,则需要一个验证过程,在搜索窗口中从后向前对文本和模式串进行比较,直到完全相等或者在某个字符处不匹配。然后,无论匹配与否,根据搜索窗口的最后一个字符β在模式串中的下一个出现位置将窗口向右移动。
3、代码:
Horspool(P=P1 P2 ....Pm,T=T1 T2 ....Tn)
   preprocessing
      for c∈Σ do d[c]<-m
   searching
      pos<-0
      while pos<=n-m do
          j<-m
          while j>0 and T(pos+j)=Pj do j<-j-1
             if j=0 then report an occurrence at pos+1
              pos<-pos+d[T(pos+m)]
      endof while
4、在序列AGATACGATATATAC中搜索字符串ATATA
1)m=5
d表为
A   T    *
2   1    5
2)[]表示窗口
a)[AGTA]CGATATATAC=>d[A]=2
b)AG[ATACG]ATATATAC=>G<>A,d[G]=5
c)AGATACG[ATATA]TAC=>d[A]=2
d)AGATACGAT[ATATA]C=>d[A]=2,移动后pos>n-m,搜索过程结束