BZOJ 2434 浅谈Trie树构建Fail树DFS离线线段树查询

来源:互联网 发布:网络女神思瑞 编辑:程序博客网 时间:2024/06/05 00:20

这里写图片描述
(此图乃呕心沥血之作)
世界真的很大
这道题从开始做算起已经过了3天了,一直没有什么比较集中的时间来调
实在是没想到今天这么快就调出来了
所以说这道题代码感觉很长却并不是很难调
由于我不会树状数组,就只能用线段树来代替了233
但代码好像实在是长了点。。。

看题先:


description:

 阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机。打字机上只有28个按键,分别印有26个小写英文字母和'B''P'两个字母。经阿狸研究发现,这个打字机是这样工作的:l 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最后)。l 按一下印有'B'的按键,打字机凹槽中最后一个字母会消失。l 按一下印有'P'的按键,打字机会在纸上打印出凹槽中现有的所有字母并换行,但凹槽中的字母不会消失。例如,阿狸输入aPaPBbP,纸上被打印的字符如下:aaaab我们把纸上打印出来的字符串从1开始顺序编号,一直到n。打字机有一个非常有趣的功能,在打字机中暗藏一个带数字的小键盘,在小键盘上输入两个数(x,y)(其中1≤x,y≤n),打字机会显示第x个打印的字符串在第y个打印的字符串中出现了多少次。阿狸发现了这个功能以后很兴奋,他想写个程序完成同样的功能,你能帮助他么?

input:

输入的第一行包含一个字符串,按阿狸的输入顺序给出所有阿狸输入的字符。第二行包含一个整数m,表示询问个数。接下来m行描述所有由小键盘输入的询问。其中第i行包含两个整数x, y,表示第i个询问为(x, y)。

output:

 输出m行,其中第i行包含一个整数,表示第i个询问的答案。

这道题分为两个部分,首先是由给出的字符串得出所有的字符串,然后读入n组询问,得出所有询问的答案

对于第一个部分,我们会发现其实非常的简单,直接暴力按照题目所给出要求去模拟,很容易得出所有的字符串

考虑到,理论上来讲,所有字符串的总长应该是n^2的,数据范围决定了不可能把所有的字符串完全保存下来,而考虑我们在查询的时候不可能不知道查询的字符串是什么吧?而这么大的数据量,应该能想到trie树,而重新去看一下题面,这不正好是建trie树的过程吗

那么此时第一步就处理好了,现在考虑处理第二部分
一个字符串在另一个字符串出现了几次,一般想来就是KMP,但这个不用说肯定是不能接受的
忽然想到trie树是字符串的前缀树
那么考虑一个串作为子串在另一个串里面出现过,一定是作为一个前缀的一个后缀出现的。
考虑trie树上在构建AC自动机时的fail指针,指的就是这个字符串的最长后缀,那么对于y串的每一个前缀,只要其的后缀有x串,等价于从某个前缀开始跳fail指针能够跳到x串,就说明x串在y串里面出现了一次,而且由于末端点不同,就绝对不会相同

这就是fail树的基本原理

考虑在trie树上,每个点的fail指针向这个店连边,由于每个点只有一个fail,所以最后构造出来的一定是一种树形结构,叫fail树
而对于一个点,其在fail树上的子树里的所有点,必然是在trie树上跳fail最后能跳到这个点在trie树上的对应点的
而如果一个点在trie树里通过跳fail能跳到另一个点那里,等价于另一个点在trie树上对应的字符串是这个点的对应的字符串的后缀
而在fail树上,一个点的子树里全部都是能够跳fail跳到这个点的点,等价于这个点是其子树里面所有点的后缀。

考虑求解x这个字符串在y里面出现了多少次,就是说x是y的多少个前缀的后缀,就是求x在trie树里面的子树里面有多少是y的前缀。

现在考虑怎么快速的得到x的子树里面有多少个y的前缀
那么我们就想到,把y的所有前缀在fail树里面打上标记,然后统计x的子树里面有多少个标记
这一点我们可以用线段树来做到

但是我们每一次查询如果都取把所有y的前缀都打上标记,这显然是不得行的。尽管查询的时候很优,但是修改的时候时间成本耗费太大,这是由于在fail树上y的所有前缀并不是连续的,所以只能一个一个的改
但是前缀在fail树上却是连续的
那我们考虑把询问离线掉,按照一开始建fail树的步骤取遍历一遍trie树,每到一个点,就把这个点在fail树上的对应位置+1,离开时就-1,这样在查询一个点的时候,他的所有前缀都+1的了
这样的话就直接可以查询x个字符串的对应点的子树里面有多少个为1的点了。
由于fail树是一颗树,而树的一个点的一个子树里面的点的dfs序一定是连在一起的,所以子树查询可以用线段树来做到

完整代码:

#include<stdio.h>#include<cstring>#include<algorithm>#include<string.h>using namespace std; struct node{    node *fail,*fa;    node *nxt[26];    int cnt,mrk,book;}*state[200010],pool[200010],*tail=pool,*root;struct edge{    int v,last;}ed[200010];struct Node{    int sum;    Node *ls,*rs;    void update()    {        sum=ls->sum+rs->sum;    }}ppool[200010],*ttail=ppool,*rot;struct question{    int x,y,ans,id;}q[200010];char ss[100010];int len,n,num=0,idx=0,tot=0,head[200010],in[200010],out[200010],rev[100010],inc=0;void add(int u,int v){    num++;    ed[num].v=v;    ed[num].last=head[u];    head[u]=num;}bool cmp1(const question &a,const question &b){    return a.y<b.y;}bool cmp2(const question &a,const question &b){    return a.id<b.id;}node* newnode(){    node *nd=++tail;    nd->fail=nd->fa=0;    nd->mrk=nd->book=-1;    memset(nd->nxt,0,sizeof(nd->nxt));    nd->cnt=0;    return nd;}void ACbuild(){    root=newnode();    root->fa=root;    node *p=root;    root->mrk=tot;    len=strlen(ss);    for(int i=0;i<len;i++)    {        if(ss[i]=='P')        {            p->cnt++;            p->book=++inc;            rev[p->book]=p->mrk;        }           else if(ss[i]=='B')            p=p->fa;        else        {            int k=ss[i]-'a';            if(!p->nxt[k])            {                p->nxt[k]=newnode();                p->nxt[k]->fa=p;                p->nxt[k]->mrk=++tot;            }            p=p->nxt[k];        }    }}void build(){    int h=0,t=0;    state[t]=root;    root->fail=0;    while(h<=t)    {        node* tmp=state[h++];        node* p=0;        for(int i=0;i<26;i++)        if(tmp->nxt[i])        {            if(tmp==root)                 tmp->nxt[i]->fail=root;            else            {                p=tmp->fail;                while(p)                {                    if(p->nxt[i])                    {                        tmp->nxt[i]->fail=p->nxt[i];                        break ;                    }                    p=p->fail;                }                if(!p)                     tmp->nxt[i]->fail=root;            }            add(tmp->nxt[i]->fail->mrk,tmp->nxt[i]->mrk);            state[++t]=tmp->nxt[i];        }    }}Node* build(int lf,int rg){    Node *nd=++ttail;    if(lf==rg)    {        nd->sum=0;        nd->ls=nd->rs=0;        return nd;    }    int mid=(lf+rg)>>1;    nd->ls=build(lf,mid);    nd->rs=build(mid+1,rg);    nd->update();    return nd;}void dfs(int u){    in[u]=++idx;    for(int i=head[u];i;i=ed[i].last)    {        int v=ed[i].v;        dfs(v);    }    out[u]=idx;}void modify(Node *nd,int lf,int rg,int pos,int delta){    if(lf==rg)    {        nd->sum+=delta;        return ;    }    int mid=(lf+rg)>>1;    if(pos<=mid) modify(nd->ls,lf,mid,pos,delta);    else modify(nd->rs,mid+1,rg,pos,delta);    nd->update();}int query(Node *nd,int lf,int rg,int L,int R){    if(L<=lf && rg<=R)        return nd->sum;    int mid=(lf+rg)>>1,rt=0;    nd->update();    if(L<=mid) rt+=query(nd->ls,lf,mid,L,R);    if(R>mid) rt+=query(nd->rs,mid+1,rg,L,R);    nd->update();    return rt;}void solve(){    node *p=root;    int now=1;    for(int i=0;i<len;i++)    {        int k=ss[i]-'a';        if(ss[i]=='P' && p->cnt)        {            while(q[now].y==p->book && now<=n)                q[now].ans=query(rot,1,idx,in[rev[q[now].x]],out[rev[q[now].x]]),now++;            if(now>n) return ;        }        else if(ss[i]=='B')             modify(rot,1,idx,in[p->mrk],-1),p=p->fa;        else            p=p->nxt[k],modify(rot,1,idx,in[p->mrk],1);    }}int main(){    scanf("%s",ss);    ACbuild();    build();    dfs(root->mrk);    scanf("%d",&n);    for(int i=1;i<=n;i++)        scanf("%d%d",&q[i].x,&q[i].y),q[i].id=i;    sort(q+1,q+n+1,cmp1);    rot=build(1,idx);    solve();    sort(q+1,q+n+1,cmp2);    for(int i=1;i<=n;i++)        printf("%d\n",q[i].ans);    return 0;}/*EL PSY CONGROO*/

嗯,就是这样

原创粉丝点击