Horspool(字符串匹配)算法
来源:互联网 发布:oracle数据库添加字段 编辑:程序博客网 时间:2024/05/23 17:35
Horsepool算法是Boyer-Moore算法的简化版本,这也是一个空间换时间的典型例子。算法把模式P和文本T的开头字符对齐,从模式的最后一个字符开始比较,如果尝试比较失败了,它把模式向后移。每次尝试过程中比较是从右到左的。
假设文本中,对齐模式最后一个字符的元素是c,Horspool算法根据c的不同情况来确定移动距离,无论c是否和模式的最后一个字符相匹配。
一般来说,会存在下面四种情况。
情况1:看第一行,模式中不存在c(此时c就是字母A),模式的移动长度就是它的全部长度,移到第二行所示的位置。
情况2:看第二行,c(此时c就是字符O)正好是模式的最后一个字符,但是从右向左比较时,有字符不匹配,比如此时的A和E不匹配。而且模式中的其他m-1个字符也不包含c。移动的情况类似情况1,移动的幅度等于模式的全部长度,移到第三行所示的位置。
情况3:看第一行,模式中存在c(此时c就是字符L),但是它不是模式的最后一个字符,移动时应该把模式中最右边的c和文本中的c对齐,移到第二行所示的位置。
情况4:看第二行,c(此时c就是字符O)正好是模式的最后一个字符,但是从右向左比较时,有字符不匹配,比如此时的A和E不匹配。而此时模式中的其他m-1个字符包含c。移动的情况类似情况3,移动时应该把前m-1个字符中最右边的c和文本中的c对齐,移到第三行所示的位置。
这说明,比起蛮力算法每次总是移动一个位置,从右到左的字符比较使模式模式移动得更远。然而,如果在每次尝试时都必须检查模式中的每个字符,它的优势也会丧失殆尽。我们可以预先算出遇到某个字符要移动的距离,并把它存在一个表中。具体来说,对于每一个字符c,可以通过以下公式算出移动距离:
如对于模式BARBER,移动距离如下表所示:
c++实现
int Horspool(vector<char> & T,vector<char> & P){ int n = T.size(); int m = P.size(); vector<int> table(96,m);//以字母表中可打印字符为索引的数组 for(int i = 0;i < m - 1;i++) { table[P[i] - 32] = m - 1 - i;//模式串中每个字符的移动距离,从左至右扫描模式,相同字符的最后一次改写恰好是该字符在模式串的最右边 } int i = m - 1; while(i <= n - 1) { int k = 0; while(k <= m - 1 && P[m - 1 - k] == T[i - k]) k++; if(k == m) return i - m + 1;//匹配成功,返回索引 else i += table[T[i] - 32];//模式串向右移动 } return -1;//匹配失败}
- Horspool字符串匹配算法
- Horspool字符串匹配算法
- Horspool字符串匹配算法
- HorsPool字符串匹配算法
- 字符串匹配算法horspool
- Horspool(字符串匹配)算法
- 字符串匹配之Horspool算法
- 字符串匹配之horspool算法
- 字符串匹配算法 之 (Horspool )Boyer-Moore-Horspool
- 【算法学习】horspool查找匹配字符串
- 字符串匹配 — Horspool
- 快速字符串模糊匹配--基于Horspool的模糊匹配算法
- 字符串匹配之horspool算法(简化的BM算法)
- sunday、kmp、 bm、 horspool字符串匹配算法 code
- 字符串匹配---KMP,Horspool,Boyer-Moore和Sunday等算法
- 字符串模式匹配之Brute force、KMP、Horspool算法
- 字符串模式匹配算法——BM、Horspool、Sunday、KMP、KR、AC算法一网打尽
- 算法设计与分析基础-7.2、字符串匹配中的输入增强技术,Horspool算法
- 【VPS】尊云服务器怎么样我来评论
- BestCoder Round #82 ztr loves mat
- 执行过程 —— WEB项目启动、执行到销毁全过程总结
- 专题三 第五题
- iOS分类中通过runtime添加动态属性
- Horspool(字符串匹配)算法
- Unity Official Tutorial OF PICKING UP COLLECTABLES --- Player Movement & Collision Detection
- 33. Implement strStr()
- Maven的使用方法
- 认真郭浩每一天
- c++ Bitsets
- 校园网无法拨号的一些解决方案
- CSS3实现DIV圆角完整代码
- TortoiseSVN使用方法简介