BZOJ 2434 浅谈Trie树构建Fail树DFS离线线段树查询
来源:互联网 发布:网络女神思瑞 编辑:程序博客网 时间:2024/06/05 00:20
(此图乃呕心沥血之作)
世界真的很大
这道题从开始做算起已经过了3天了,一直没有什么比较集中的时间来调
实在是没想到今天这么快就调出来了
所以说这道题代码感觉很长却并不是很难调
由于我不会树状数组,就只能用线段树来代替了233
但代码好像实在是长了点。。。
看题先:
description:
阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机。打字机上只有28个按键,分别印有26个小写英文字母和'B'、'P'两个字母。经阿狸研究发现,这个打字机是这样工作的:l 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最后)。l 按一下印有'B'的按键,打字机凹槽中最后一个字母会消失。l 按一下印有'P'的按键,打字机会在纸上打印出凹槽中现有的所有字母并换行,但凹槽中的字母不会消失。例如,阿狸输入aPaPBbP,纸上被打印的字符如下:aaaab我们把纸上打印出来的字符串从1开始顺序编号,一直到n。打字机有一个非常有趣的功能,在打字机中暗藏一个带数字的小键盘,在小键盘上输入两个数(x,y)(其中1≤x,y≤n),打字机会显示第x个打印的字符串在第y个打印的字符串中出现了多少次。阿狸发现了这个功能以后很兴奋,他想写个程序完成同样的功能,你能帮助他么?
input:
输入的第一行包含一个字符串,按阿狸的输入顺序给出所有阿狸输入的字符。第二行包含一个整数m,表示询问个数。接下来m行描述所有由小键盘输入的询问。其中第i行包含两个整数x, y,表示第i个询问为(x, y)。
output:
输出m行,其中第i行包含一个整数,表示第i个询问的答案。
这道题分为两个部分,首先是由给出的字符串得出所有的字符串,然后读入n组询问,得出所有询问的答案
对于第一个部分,我们会发现其实非常的简单,直接暴力按照题目所给出要求去模拟,很容易得出所有的字符串
考虑到,理论上来讲,所有字符串的总长应该是n^2的,数据范围决定了不可能把所有的字符串完全保存下来,而考虑我们在查询的时候不可能不知道查询的字符串是什么吧?而这么大的数据量,应该能想到trie树,而重新去看一下题面,这不正好是建trie树的过程吗
那么此时第一步就处理好了,现在考虑处理第二部分
一个字符串在另一个字符串出现了几次,一般想来就是KMP,但这个不用说肯定是不能接受的
忽然想到trie树是字符串的前缀树
那么考虑一个串作为子串在另一个串里面出现过,一定是作为一个前缀的一个后缀出现的。
考虑trie树上在构建AC自动机时的fail指针,指的就是这个字符串的最长后缀,那么对于y串的每一个前缀,只要其的后缀有x串,等价于从某个前缀开始跳fail指针能够跳到x串,就说明x串在y串里面出现了一次,而且由于末端点不同,就绝对不会相同
这就是fail树的基本原理
考虑在trie树上,每个点的fail指针向这个店连边,由于每个点只有一个fail,所以最后构造出来的一定是一种树形结构,叫fail树
而对于一个点,其在fail树上的子树里的所有点,必然是在trie树上跳fail最后能跳到这个点在trie树上的对应点的
而如果一个点在trie树里通过跳fail能跳到另一个点那里,等价于另一个点在trie树上对应的字符串是这个点的对应的字符串的后缀
而在fail树上,一个点的子树里全部都是能够跳fail跳到这个点的点,等价于这个点是其子树里面所有点的后缀。
考虑求解x这个字符串在y里面出现了多少次,就是说x是y的多少个前缀的后缀,就是求x在trie树里面的子树里面有多少是y的前缀。
现在考虑怎么快速的得到x的子树里面有多少个y的前缀
那么我们就想到,把y的所有前缀在fail树里面打上标记,然后统计x的子树里面有多少个标记
这一点我们可以用线段树来做到
但是我们每一次查询如果都取把所有y的前缀都打上标记,这显然是不得行的。尽管查询的时候很优,但是修改的时候时间成本耗费太大,这是由于在fail树上y的所有前缀并不是连续的,所以只能一个一个的改
但是前缀在fail树上却是连续的
那我们考虑把询问离线掉,按照一开始建fail树的步骤取遍历一遍trie树,每到一个点,就把这个点在fail树上的对应位置+1,离开时就-1,这样在查询一个点的时候,他的所有前缀都+1的了
这样的话就直接可以查询x个字符串的对应点的子树里面有多少个为1的点了。
由于fail树是一颗树,而树的一个点的一个子树里面的点的dfs序一定是连在一起的,所以子树查询可以用线段树来做到
完整代码:
#include<stdio.h>#include<cstring>#include<algorithm>#include<string.h>using namespace std; struct node{ node *fail,*fa; node *nxt[26]; int cnt,mrk,book;}*state[200010],pool[200010],*tail=pool,*root;struct edge{ int v,last;}ed[200010];struct Node{ int sum; Node *ls,*rs; void update() { sum=ls->sum+rs->sum; }}ppool[200010],*ttail=ppool,*rot;struct question{ int x,y,ans,id;}q[200010];char ss[100010];int len,n,num=0,idx=0,tot=0,head[200010],in[200010],out[200010],rev[100010],inc=0;void add(int u,int v){ num++; ed[num].v=v; ed[num].last=head[u]; head[u]=num;}bool cmp1(const question &a,const question &b){ return a.y<b.y;}bool cmp2(const question &a,const question &b){ return a.id<b.id;}node* newnode(){ node *nd=++tail; nd->fail=nd->fa=0; nd->mrk=nd->book=-1; memset(nd->nxt,0,sizeof(nd->nxt)); nd->cnt=0; return nd;}void ACbuild(){ root=newnode(); root->fa=root; node *p=root; root->mrk=tot; len=strlen(ss); for(int i=0;i<len;i++) { if(ss[i]=='P') { p->cnt++; p->book=++inc; rev[p->book]=p->mrk; } else if(ss[i]=='B') p=p->fa; else { int k=ss[i]-'a'; if(!p->nxt[k]) { p->nxt[k]=newnode(); p->nxt[k]->fa=p; p->nxt[k]->mrk=++tot; } p=p->nxt[k]; } }}void build(){ int h=0,t=0; state[t]=root; root->fail=0; while(h<=t) { node* tmp=state[h++]; node* p=0; for(int i=0;i<26;i++) if(tmp->nxt[i]) { if(tmp==root) tmp->nxt[i]->fail=root; else { p=tmp->fail; while(p) { if(p->nxt[i]) { tmp->nxt[i]->fail=p->nxt[i]; break ; } p=p->fail; } if(!p) tmp->nxt[i]->fail=root; } add(tmp->nxt[i]->fail->mrk,tmp->nxt[i]->mrk); state[++t]=tmp->nxt[i]; } }}Node* build(int lf,int rg){ Node *nd=++ttail; if(lf==rg) { nd->sum=0; nd->ls=nd->rs=0; return nd; } int mid=(lf+rg)>>1; nd->ls=build(lf,mid); nd->rs=build(mid+1,rg); nd->update(); return nd;}void dfs(int u){ in[u]=++idx; for(int i=head[u];i;i=ed[i].last) { int v=ed[i].v; dfs(v); } out[u]=idx;}void modify(Node *nd,int lf,int rg,int pos,int delta){ if(lf==rg) { nd->sum+=delta; return ; } int mid=(lf+rg)>>1; if(pos<=mid) modify(nd->ls,lf,mid,pos,delta); else modify(nd->rs,mid+1,rg,pos,delta); nd->update();}int query(Node *nd,int lf,int rg,int L,int R){ if(L<=lf && rg<=R) return nd->sum; int mid=(lf+rg)>>1,rt=0; nd->update(); if(L<=mid) rt+=query(nd->ls,lf,mid,L,R); if(R>mid) rt+=query(nd->rs,mid+1,rg,L,R); nd->update(); return rt;}void solve(){ node *p=root; int now=1; for(int i=0;i<len;i++) { int k=ss[i]-'a'; if(ss[i]=='P' && p->cnt) { while(q[now].y==p->book && now<=n) q[now].ans=query(rot,1,idx,in[rev[q[now].x]],out[rev[q[now].x]]),now++; if(now>n) return ; } else if(ss[i]=='B') modify(rot,1,idx,in[p->mrk],-1),p=p->fa; else p=p->nxt[k],modify(rot,1,idx,in[p->mrk],1); }}int main(){ scanf("%s",ss); ACbuild(); build(); dfs(root->mrk); scanf("%d",&n); for(int i=1;i<=n;i++) scanf("%d%d",&q[i].x,&q[i].y),q[i].id=i; sort(q+1,q+n+1,cmp1); rot=build(1,idx); solve(); sort(q+1,q+n+1,cmp2); for(int i=1;i<=n;i++) printf("%d\n",q[i].ans); return 0;}/*EL PSY CONGROO*/
嗯,就是这样
- BZOJ 2434 浅谈Trie树构建Fail树DFS离线线段树查询
- BZOJ 2434 ac自动机fail树+dfs序+树状数组+离线处理
- BZOJ 2434 阿狸的打字机 补全AC自动机 ( Trie图 ) fail树 树状数组 DFS序列
- HDU4288Coder(线段树+离线查询)
- 【BZOJ 2938】[Poi2000]病毒 fail树+dfs判环
- BZOJ 2743 [HEOI2012]采花 离线+线段树
- bzoj 3339 Rmq problem 离线+线段树
- BZOJ 3626 离线+树链剖分+线段树
- bzoj 3339 线段树离线处理
- BZOJ 2434: [Noi2011]阿狸的打字机【AC自动机,fail树.dfs序,树状数组
- bzoj 2434 [Noi2011]阿狸的打字机(AC自动机+fail树+dfs序+树状数组)
- bzoj 3306: 树 dfs序+线段树
- BZOJ 1103 DFS序+线段树
- BZOJ 4034 线段树+DFS序
- BZOJ 2819 DFS序+线段树
- BZOJ 3252攻略 dfs序+线段树
- DFS序+线段树(bzoj 4034)
- bzoj 4551(DFS序+线段树)
- 安装SQL SERVER2016或者2017时 安装程序无法与下载服务器联系 Microsoft R Server
- opus编解码的使用
- Java中常用的查找算法
- LinuxC编写TCP,HTTP中转SOCKET服务器(模拟)
- Hadoop生态系统图
- BZOJ 2434 浅谈Trie树构建Fail树DFS离线线段树查询
- CentOS7下解决yum install mysql-server没有可用包的问题
- MAVEN IDEA SSM框架搭建《二》
- Result从select count(0)中获取结果
- Oracle 开启异步IO
- Java EE开发第四章:JDBC的基本使用
- 小猴子下落
- linux tail命令的使用方法详解
- nginx proxy_pass 反向代理