trie树的 表示方法和实现

来源:互联网 发布:淘宝网二手手机商城 编辑:程序博客网 时间:2024/05/16 12:58
#include <vector>#include<cstring>#include<iostream>#include <set>#include <algorithm>using namespace std;#define INF  1000000;//引用只是纯粹的一个变量的别名,至于怎么做到的和指针无关,和语言设计方法有关,待深究;typedef struct node{char c;node *firstchild,*nextsibling;node():c('\0'),firstchild(NULL),nextsibling(NULL){}}node,*pointer;/* 指针版本的左孩子,右兄弟表示法;插入元素和查找元素的速度为最坏情况下 26*strlen(str);但对于遍历整棵树而言花费时间代价很低;*/struct Trie{pointer root;Trie(){root=new node();}void insert(char* s,int i,int n,pointer& root){if(i==n) return ;pointer u=root; //必须用一个新指针,不然下面操作改变了root的指向;if(u!=NULL) while(u->nextsibling!=NULL&&u->c!=s[i]) u=u->nextsibling;if(u==NULL||u->nextsibling==NULL&&u->c!=s[i]){    pointer& v = (u==NULL ? root:u->nextsibling);//NULL时必须赋值为root,因为要改变该指针的指向;    v=new node();    v->c=s[i];    insert(s,i+1,n,v->firstchild);}else insert(s,i+1,n,u->firstchild);}void Insert(char* s){int n=strlen(s);insert(s,0,n,root);}bool find(char* s,int i,int n,pointer& root){if(i==n) return true;pointer u=root;if(u==NULL) return false;while(u->nextsibling!=NULL&&u->c!=s[i]) u=u->nextsibling;if(u->nextsibling==NULL&&u->c!=s[i]) return false;return find(s,i+1,n,u->firstchild);}bool Find(char* s,int n){return find(s,0,n,root);}};int main(){  char str[1000];  Trie trie;  while(gets(str)!=NULL&&str[0]!='#'){       trie.Insert(str);  }  while(gets(str)!=NULL){        if(trie.Find(str,strlen(str))) printf("find\n");        else printf("not find\n");  }  return 0;}

上述插入和建树用的是递归的方式;

而循环版本并不好写(每到一个结点都是站在结点的孩子头上,而不是父亲指针那里,所以写起来很麻烦),因为同s[i]  -- > s[i+1] 下一次要用的指针必须为某个特定指针,只能通过递归传引用

void insert(char* s,int n){pointer& Root=root;for(int i=0;i<n;i++){    pointer u=Root;    if(u!=NULL)while(u->nextsibling!=NULL&&u->c!=s[i]) u=u->nextsibling;    if(u==NULL||u->nextsibling==NULL&&u->c!=s[i]){        pointer& v=(u==NULL ? Root:u->nextsibling);        v=new node();        v->c=s[i];        Root=v->firstchild;    }    else Root=u->firstchild;(这样的写法错误,因为Root为根结点的引用,对它的修改即修改了根结点)}}

每次都站在父节点上考虑,就好写多,下面为指针--循环版;

#include <cstdio>#include <cstring>#include <iostream>using namespace std;typedef struct node{char c;node *firstchild,*nextsibling;node():c('\0'),firstchild(NULL),nextsibling(NULL){}}node,*pointer;struct Trie{pointer root;Trie(){root=new node();}void insert(char* s,int n){pointer u=root;for(int i=0;i<n;i++){    pointer v=u->firstchild;    if(v!=NULL) while(v->nextsibling!=NULL&&v->c!=s[i]) v=v->nextsibling;    if(v==NULL||v->nextsibling==NULL&&v->c!=s[i]){        pointer& p=(v==NULL ? u->firstchild:v->nextsibling);        p=new node();        p->c=s[i];        u=p;    }    else u=v;}}bool find(char* s,int n){pointer u=root;for(int i=0;i<n;i++){    pointer v=u->firstchild;    if(v==NULL) return false;    while(v->nextsibling!=NULL&&v->c!=s[i]) v=v->nextsibling;    if(v->nextsibling==NULL&&v->c!=s[i]) return false;    u=v;}return true;}};int main(){  char str[1000];  Trie trie;  while(gets(str)!=NULL&&str[0]!='#'){       trie.insert(str,strlen(str));  }  while(gets(str)!=NULL){        if(trie.find(str,strlen(str))) printf("find\n");        else printf("not find\n");  }  return 0;}


pointer p=p1;  指针p的指向与p1相同(对p而言,指向改变,而对p1而言多了一个和他指向同一块内存区域的指针);

pointer& p=p1;对p1而言多了一个可以用的名字;

第三点,就是改变发生的情况不同。




下面为左孩子,右兄弟的数组表示方法

#include <cstdio>#include <cstring>#include <iostream>using namespace std;struct Trie{static const int maxn = 100001;Trie():tot(2){memset(firstchild,0,sizeof(firstchild));memset(nextsibling,0,sizeof(nextsibling));memset(c,0,sizeof(c));}char c[maxn];int firstchild[maxn],nextsibling[maxn],tot;void insert(char* s,int n){int u=1;for(int i=0;i<n;i++){    int v=firstchild[u];    if(v!=0) while(nextsibling[v]!=0&&c[v]!=s[i]) v=nextsibling[v];    if(!v||nextsibling[v]==0&&c[v]!=s[i]){          int& p=(v==0 ? firstchild[u]:nextsibling[v]);          p=tot;          c[tot]=s[i];          u=tot++;    }    else u=v;}}bool find(char* s,int n){int u=1;for(int i=0;i<n;i++){    int v=firstchild[u];    if(!v) return false;    while(nextsibling[v]!=0&&c[v]!=s[i]) v=nextsibling[v];    if(nextsibling[v]==0&&c[v]!=s[i]) return false;    else u=v;}return true;}};int main(){  char str[1000];  Trie trie;  while(gets(str)!=NULL&&str[0]!='#'){       trie.insert(str,strlen(str));  }  while(gets(str)!=NULL){        if(trie.find(str,strlen(str))) printf("find\n");        else printf("not find\n");  }  return 0;}

下面为用孩子数组实现的版本


#include <cstdio>#include <cstring>#include <iostream>using namespace std;/*孩子数组表示法(即将每个结点的孩子存下来,图是用标号链接的每个结点的内容,用附加数组表示)本表示方法的试用于总结点数(maxn)较少的情况;遍历整棵树非常费时,但在插入和查找的时候是o(strlen(str))的时间;*/struct Trie{static const int maxn = 10000;static const int sigma_size = 27;int tot,c[maxn],son[maxn][sigma_size];Trie():tot(2){memset(son,-1,sizeof(son));}void insert(char* s,int n){int u=1;for(int i=0;i<n;i++){    int word=s[i]-'a';    if(son[u][word]==-1){         son[u][word]=tot;         u=tot++;    }    else u=son[u][word];}}bool find(char* s,int n){int u=1;for(int i=0;i<n;i++){    int word=s[i]-'a';    if(son[u][word]==-1) return false;    u=son[u][word];}return true;}};int main(){  char str[1000];  Trie trie;  while(gets(str)!=NULL&&str[0]!='#'){       trie.insert(str,strlen(str));  }  while(gets(str)!=NULL){        if(trie.find(str,strlen(str))) printf("find\n");        else printf("not find\n");  }  return 0;}


0 0
原创粉丝点击