【后缀自动机sam学习小记】
来源:互联网 发布:最基本的网络拓扑结构 编辑:程序博客网 时间:2024/06/05 07:56
定义
顾名思义,后缀自动机就是可以识别原串所有后缀的自动机,最后回到达叶子状态,同时也可以识别所有连续子串。
时间复杂度
线性。由构造方法可知点数是线性的。构出sam后除了主链,即代表原串的链,其他的边要么就是构成了一个新的后缀,要么就是连接若干条构成了一个新的后缀的边,形成一个类似树的结构,所以边也是线性的。
各种东西的意义
很多性质都由定义得出,理解定义就可以发现很多性质。
right
一个字符串的right集即出现这个字符串[l,r)的所有r的集合。
能走到sam上同一个节点的字符串right集一定相同,一个节点的right集即任意一个能到达当前节点的字符串的right集。
right集只有包含与被包含或无交集,当r相同时增大l,right集不会减小。
fa
即parent,就是最小的right集,包含当前right集。
mx
使当前right集合法的最大长度,可以发现,使当前right集合法的最小长度即fa的mx加1。
构造
考虑上一个加入的字符所代表的点p,当前要加入的字符所代表的点np,新建一条p=>np的边,mx[np]=mx[p]+1,这个比较显然,其实就是当前字符串的长度。
考虑找p的fa,找到第一个由当前字符转移的点q,类似于ac自动机跳fail,找到最大的right集包含当前的right集,且包含当前字符转移的,对之前的点都连一条到np的边。由连边方式可以发现当前p的所有fa都一定有当前字符转移的边。
设p连出去的点为q,当mx[p]+1==mx[q]时可以发现q是由p直接转移过来的,可以直接加上当前字符,把np的fa设为q即可。当mx[p]+1!=mx[q]时可以发现p到q之间经过了多于一个字符,我们必须新建状态来表示当前情况,设这个点为nq,可以发现nq的mx比q的mx小,即right集较大,而p的mx比nq的mx小,即right集较大。所以q是nq的子集,nq是q的子集,fa[q]=nq,fa[nq]=p,fa[np]=nq,mx[nq]=mx[p]+1>
同时我们要处理nq的转移,可以发现q的转移和nq一样,而之前转移到q的状态就要先转移到nq,这个很容易证明。至此我们就完成了sam的构造。
应用
sam的应用很灵活,体现在它自动机的特性和parent树,还有right集的各种特性,具体的例子留坑待填。
code
例题链接
#include<cstdio>#include<cstring>#include<algorithm>#define LL long long#define ULL unsigned long long#define fo(i,j,k) for(int i=j;i<=k;i++)#define fd(i,j,k) for(int i=j;i>=k;i--)using namespace std;int const mn=5*1e5+9,mp=1e6+9,inf=1e9+7;int t,K,n,pon,f[mp],g[mp],son[mp][26],fa[mp],mx[mp],du[mp],qu[mp];char s[mn];int main(){ //freopen("string.in","r",stdin); //freopen("string.out","w",stdout); freopen("d.in","r",stdin); freopen("d.out","w",stdout); scanf("%s",s+1);n=strlen(s+1); fo(i,1,n)s[i]-='a'; scanf("%d%d",&t,&K); int last=pon=1; fo(i,1,n){ int p=last,np=last=++pon; mx[np]=mx[p]+1;f[np]=1; for(;p&&(!son[p][s[i]]);p=fa[p])son[p][s[i]]=np; if(!p){fa[np]=1;continue;} int q=son[p][s[i]]; if(mx[p]+1==mx[q])fa[np]=q; else{ int nq=++pon;mx[nq]=mx[p]+1; fa[nq]=fa[q]; fa[np]=fa[q]=nq; fo(j,0,25)son[nq][j]=son[q][j]; for(;p&&(son[p][s[i]]==q);p=fa[p])son[p][s[i]]=nq; } p=np; } fo(i,1,pon)du[fa[i]]++; int he=0,ti=0; fo(i,1,pon)if(!du[i])qu[++ti]=i; while(he!=ti){ int now=qu[++he],next=fa[now]; du[next]--; f[next]+=f[now]; if(!du[next])qu[++ti]=next; } if(!t)fo(i,1,pon)f[i]=1; fo(i,1,pon)g[i]=f[i]; fo(i,1,pon)fo(j,0,25)du[son[i][j]]++; he=0,ti=0; qu[++ti]=1;du[0]++; while(he!=ti){ int now=qu[++he]; fo(i,0,25){ int next=son[now][i]; du[next]--; if(!du[next])qu[++ti]=next; } } fd(i,ti,1)fo(j,0,25){ int now=qu[i],next=son[now][j]; if(next)g[now]+=g[next]; } int now=1; if(K>g[1]){printf("-1");return 0;} while(1){ fo(i,0,25){ int next=son[now][i]; if(!next)continue; if(g[next]<K)K-=g[next]; else{ printf("%c",'a'+i); K-=f[next]; now=next; if(K<=0)return 0; break; } } } return 0;}
0 0
- 【后缀自动机sam学习小记】
- 后缀自动机(SAM)学习小记
- 后缀自动机学习小记
- 后缀自动机学习小记
- 后缀自动机学习小记
- SAM后缀自动机学习小记 Poj 1509 Glass Beads (字符串最小表示)
- 后缀自动机(SAM)学习笔记
- SAM 后缀自动机——学习笔记
- 后缀自动机-SAM学习大记
- [SAM]后缀自动机
- 后缀自动机SAM
- Sam后缀自动机模板
- 后缀自动机SAM
- 后缀自动机SAM
- 后缀自动机(SAM)
- spoj lcs2 后缀自动机SAM
- hdu4436 str2int 后缀自动机 SAM
- 后缀自动机(SAM)学习指南
- 算法导论 练习题 12.1-2
- Makefile的例子:Sequential和OpenMP版本(make)
- Linux中sed命令介绍
- linux转换caps lock与ESC
- javascript实现点我加一
- 【后缀自动机sam学习小记】
- js常用函数
- TOAD连接Oracle数据库失败:OCI_INVALID_HANDLE解决
- 第一个jsp
- 初始化项目——快捷键
- 二叉树的递归和非递归前、中、后序遍历
- c++的浅复制与深复制
- HDU5631 Rikka with Graph
- 剑指offer——合并链表