AC自动机总结

来源:互联网 发布:录像监控软件 编辑:程序博客网 时间:2024/05/29 19:09

1.N个字符串作为字典,和一个长字符串,询问长字符串中出现了多少字典中的串

AC自动机,把待匹配的字符串放在自动机上奔跑,每到达一个ed节点都打上一个已到标识,
然后向ta的fail奔跑
因为只用计算出现了多少个字典串,不要求统计具体个数,
所以每次遇上一个打过标记的节点就不用再沿fail跑了

2.N个字符串作为字典,和一个长字符串,询问长字符串中出现了多少字典中的串并统计个数

字典建立AC自动机,建立fail树,在AC自动机上奔跑,经过的节点cnt++,
统计每个单词出现个数即统计fail树上该节点所在子树中的cnt
(这就是fail树的性质,把所有fail指针反向后,包含该串的所有长串的ed就都到了该串ed所在的子树中)

3.给出一个短串和N个长串,求多少个长串包含短串

把所有串建立AC自动机,建立fail树,看一下每一个长串的每一个点是否出现在短串ed的子树中

4.给出多个短串和多个长串,求每个短串出现在了几个长串中

短串建立AC自动机,把长串放到自动机上匹配,在匹配过程中把经过的短串ed的cnt++
统计短串ed的权值即可
优化:单点打标识,查询子树和,需要注意的是求短串的ed是取并集,
需要按照dfs序排序然后将相邻的两个点的lca-1,进行一个容斥

5.给出多个短串和多个长串,求每个长串中出现了几个短串

把所有串建立一个AC自动机,在短串ed打标记,对于每一个长串,
统计ed到根的路径上有多少标记,由于可能重复计算,我们就要应用容斥原理,
即按dfs序排序,在每一次统计时减去ta前一个节点和当前节点的lca的答案

原创粉丝点击