字符串搜索之Rabin-Karp 算法(伪代码)
来源:互联网 发布:手机简繁体转换软件 编辑:程序博客网 时间:2024/06/06 03:24
最近在听哈尔滨工业大学王宏志老师的《算法设计与分析》这门课,感觉受益匪浅。今天就记录一下有关字符串搜索的Rabin-Karp 算法。
基于指纹的算法
• 令字母表位 S={0,1,2,3,4,5,6,7,8,9}
• 令指纹为一个十进制数, 即, f(“1045”) = 1*10^3 + 0*10^2 +4*10^1 + 5 = 1045
Fingerprint-Search(T,P)
01 fp <- compute f(P)
02 f <- compute f(T[0..m–1])
03 for s <- 0 to n – m do
04 if fp = f return s
05 f <- (f – T[s]*10^(m-1) )*10 + T[s+m] //这步可以好好利用!!
06 return -1
运行时间是 2O(m) + O(n–m) = O(n)!
使用Hash 函数
• 问题: 我们不能假设我们可以对m位数在O(1)时间
内进行算术运算
• 解决方案: 使用hash函数 h = f mod q
– 例如, 如果 q = 7, h(“52”) = 52 mod 7 = 3
– h(S 1 ) <> h(S 2 ) =>S 1 <> S 2
– 但 h(S 1 ) = h(S 2 ) 不意味着 S 1 =S 2 !
• 例如, 如果 q = 7, h(“73”) = 3, 但 “73” <>“52”
• 但 “mod q” 算术运算:
– (a+b) mod q = (a mod q + b mod q) mod q //这步可以好好利用!!
– (a*b) mod q = (a mod q)*(b mod q) mod q
预处理与步骤
• 预处理:
– fp = P[m-1] + 10*(P[m-2] + 10*(P[m-3]+ … + 10*(P[1] + 10*P[0])…)) mod q //这步可以好好利用!!
– 同样地可以从T[0..m-1] 计算 ft
– 例如: P = “2531”, q = 7, fp是多少?
• 步骤:
– ft = (ft – T[s]*10 m-1 mod q)*10 + T[s+m]) mod q
– 10 m-1 mod q 在预处理中计算一次
– 例: Let T[…] = “5319”, q = 7, 对应的 ft是多少?
Rabin-Karp 算法
Rabin-Karp-Search(T,P)
01 q <- a prime larger than m
02 c <- 10^(m-1) mod q // run a loop multiplying by 10 mod q
03 fp <- 0; ft <- 0
04 for i <- 0 to m-1 // preprocessing
05 fp <- (10*fp + P[i]) mod q
06 ft <- (10*ft + T[i]) mod q
07 for s <- 0 to n – m // matching
08 if fp = ft then // run a loop to compare strings
09 if P[0..m-1] = T[s..s+m-1] return s
10 ft <- ((ft – T[s]*c)*10 + T[s+m]) mod q
11 return –1
如果T = “2531978”, P = “1978”需要比较字符多少次?
- 字符串搜索之Rabin-Karp 算法(伪代码)
- 字符串搜索--Rabin-Karp算法
- 字符串匹配算法之Rabin-Karp算法
- 字符串算法-Rabin-Karp
- 字符串匹配之Rabin-Karp算法
- 字符串匹配之Rabin-Karp 算法
- Rabin-Karp 算法(字符串快速查找)
- (三)Rabin-Karp字符串查找算法
- Rabin-Karp字符串匹配算法
- 字符串匹配--Karp-Rabin算法
- Rabin-Karp字符串匹配算法
- Rabin-Karp字符串查找算法
- Rabin-Karp字符串查找算法
- Rabin-Karp字符串查找算法
- Rabin-Karp字符串查找算法
- Rabin-Karp 字符串匹配算法
- 面试算法之字符串匹配算法,Rabin-Karp算法详解
- 算法——字符串匹配之Rabin-Karp算法
- 提高项目42-学生人数没个准
- IOS-上架APP之启动页设置(新手必看!)
- D - Pie
- 【操作系统】用户可通过三种方式使用计算机
- UISplitViewController 纯代码
- 字符串搜索之Rabin-Karp 算法(伪代码)
- C++ hdoj 2013
- Win32下session和window station以及desktop一些介绍和应用
- PHP fetch_array()与fetch_all()详解获取数据库数据的区别
- Java 中的Synchronizer
- ListView的item中有Button,ImageButton之类的控件导导致item的点击事件失效
- 如何让MySQL 数据库支持中文
- python 数据初学者 小记
- 面试题总结-Linux常用命令