算法导论第15章 动态规划-最优二叉查找树
来源:互联网 发布:热敏打印软件 编辑:程序博客网 时间:2024/05/29 15:20
1、前言:
接着学习动态规划方法,最优二叉查找树问题。二叉查找树参考http://www.cnblogs.com/Anker/archive/2013/01/28/2880581.html。如果在二叉树中查找元素不考虑概率及查找不成功的情况下,可以采用红黑树或者平衡二叉树来搜索,这样可以在O(lgn)时间内完成。而现实生活中,查找的关键字是有一定的概率的,就是说有的关键字可能经常被搜索,而有的很少被搜索,而且搜索的关键字可能不存在,为此需要根据关键字出现的概率构建一个二叉树。比如中文输入法字库中各词条(单字、词组等)的先验概率,针对用户习惯可以自动调整词频——所谓动态调频、高频先现原则,以减少用户翻查次数,使得经常用的词汇被放置在前面,这样就能有效地加快查找速度。这就是最优二叉树所要解决的问题。
2、问题描述
给定一个由n个互异的关键字组成的有序序列K={k1<k2<k3<,……,<kn}和它们被查询的概率P={p1,p2,p3,……,pn},要求构造一棵二叉查找树T,使得查询所有元素的总的代价最小。对于一个搜索树,当搜索的元素在树内时,表示搜索成功。当不在树内时,表示搜索失败,用一个“虚叶子节点”来标示搜索失败的情况,因此需要n+1个虚叶子节点{d0<d1<……<dn},对于应di的概率序列是Q={q0,q1,……,qn}。其中d0表示搜索元素小于k1的失败结果,dn表示搜索元素大于kn的失败情况。di(0<i<n)表示搜索节点在ki和k(i+1)之间时的失败情况。因此有如下公式:
由每个关键字和每个虚拟键被搜索的概率,可以确定在一棵给定的二叉查找树T内一次搜索的期望代价。设一次搜索的实际代价为检查的节点个数,即在T内搜索所发现的节点的深度加上1。所以在T内一次搜索的期望代价为:
需要注意的是:一棵最优二叉查找树不一定是一棵整体高度最小的树,也不一定总是把最大概率的关键字放在根部。
(3)动态规划求解过程
1)最优二叉查找树的结构
如果一棵最优二叉查找树T有一棵包含关键字ki,……,kj的子树T',那么这棵子树T’对于对于关键字ki,……kj和虚拟键di-1,……,dj的子问题也必定是最优的。
2)一个递归解
定义e[i,j]为搜索一棵包含关键字ki,……,kj的最优二叉查找树的期望代价,则分类讨论如下:
当j=i-1时,说明此时只有虚拟键di-1,故e[i,i-1] = qi-1
当j≥i时,需要从ki,……,kj中选择一个跟kr,然后用关键字ki,……,kr-1来构造一棵最优二叉查找树作为左子树,用关键字kr+1,……,kj来构造一棵最优二叉查找树作为右子树。定义一棵有关键字ki,……,kj的子树,定义概率的总和为:
因此如果kr是一棵包含关键字ki,……,kj的最优子树的根,则有:
故e[i,j]重写为:
最终的递归式如下:
3)计算一棵最优二叉查找树的期望搜索代价
将e[i,j]的值保存到一个二维数组e[1..1+n,0..n]中,用root[i,j]来记录关键字ki,……,kj的子树的根,采用二维数组root[1..n,1..n]来表示。为了提高效率,防止重复计算,需要个二维数组w[1..n+1,0...n]来保存w(i,j)的值,其中w[i,j] = w[i,j-1]+pj+qj。数组给出了计算过程的伪代码:
1 OPTIMAL_BST(p,q,n) 2 for i=1 to n+1 //初始化e和w的值 3 do e[i,i-1] = qi-1; 4 w[i,i-1] = qi-1; 5 for l=1 to n 6 do for i=1 to n-l+1 7 do j=i+l-1; 8 e[i,j] = MAX; 9 w[i,j] = w[i,j-1]+pj+qj;10 for r=i to j11 do t=e[i,r-1]+e[r+1,j]+w[i,j]12 if t<e[i,j]13 then e[i,j] = t;14 root[i,j] = r;15 return e and root;
4)构造一棵最优二叉查找树
根据地第三步中得到的root表,可以递推出各个子树的根,从而可以构建出一棵最优二叉查找树。从root[1,n]开始向下递推,一次找出树根,及左子树和右子树。
4、编程实现
针对一个具体的实例编程实现,现在有5个关键字,其出现的概率P={0.15,0.10,0.05,0.10,0.20},查找虚拟键的概率q={0.05,0.10,0.05,0.05,0.05,0.10}。采用C++语言是实现如下:
1 #include <iostream> 2 using namespace std; 3 #define N 5 4 #define MAX 999999.99999 5 void optimal_binary_search_tree(float *p,float *q,int n,float e[N+2][N+1],int root[N+1][N+1]); 6 void construct_optimal_bst1(int root[N+1][N+1],int i,int j); 7 void construct_optimal_bst2(int root[N+1][N+1],int i,int j); 8 int main() 9 {10 float p[N+1] = {0,0.15,0.10,0.05,0.10,0.20};11 float q[N+1] = {0.05,0.10,0.05,0.05,0.05,0.10};12 float e[N+2][N+1];13 int root[N+1][N+1];14 int i,j;15 optimal_binary_search_tree(p,q,N,e,root);16 cout<<"各个子树的期望代价如下所示:"<<endl;17 for(i=1;i<=N+1;i++)18 {19 for(j=i-1;j<=N;j++)20 cout<<e[i][j]<<" ";21 cout<<endl;22 }23 cout<<"最优二叉查找树的代价为: "<<e[1][N]<<endl;24 cout<<"各个子树根如下表所示:"<<endl;25 for(i=1;i<=N;i++)26 {27 for(j=i;j<=N;j++)28 cout<<root[i][j]<<" ";29 cout<<endl;30 }31 cout<<"构造的最优二叉查找树如下所示:"<<endl;32 construct_optimal_bst1(root,1,N);33 cout<<"\n最优二叉查找树的结构描述如下:"<<endl;34 construct_optimal_bst2(root,1,N);35 cout<<endl;36 return 0;37 }38 void optimal_binary_search_tree(float *p,float *q,int n,float e[N+2][N+1],int root[N+1][N+1])39 {40 int i,j,k,r;41 float t;42 float w[N+2][N+1];43 for(i=1;i<=N+1;++i) //主表和根表元素的初始化44 {45 e[i][i-1] = q[i-1];46 w[i][i-1] = q[i-1];47 }48 for(k=1;k<=n;++k) //自底向上寻找最优子树49 for(i=1;i<=n-k+1;i++)50 {51 j = i+k-1;52 e[i][j] = MAX;53 w[i][j] = w[i][j-1]+p[j]+q[j];54 55 for(r=i;r<=j;r++) //找最优根56 {57 t = e[i][r-1] + e[r+1][j] +w[i][j];58 59 if(t < e[i][j])60 {61 e[i][j] = t;62 root[i][j] = r;63 }64 }65 }66 }67 void construct_optimal_bst1(int root[N+1][N+1],int i,int j)68 {69 70 if(i<=j)71 {72 int r = root[i][j];73 cout<<r<<" ";74 construct_optimal_bst1(root,i,r-1);75 construct_optimal_bst1(root,r+1,j);76 }77 }78 void construct_optimal_bst2(int root[N+1][N+1],int i,int j)79 {80 if(i==1 && j== N)81 cout<<"k"<<root[1][N]<<"是根"<<endl;82 if(i<j)83 {84 int r = root[i][j];85 if(r != i)86 cout<<"k"<<root[i][r-1]<<"是k"<<r<<"的左孩子"<<endl;87 construct_optimal_bst2(root,i,r-1);88 if(r!= j)89 cout<<"k"<<root[r+1][j]<<"是k"<<r<<"的右孩子"<<endl;90 construct_optimal_bst2(root,r+1,j);91 }92 if(i==j)93 {94 cout<<"d"<<i-1<<"是k"<<i<<"左孩子"<<endl;95 cout<<"d"<<i<<"是k"<<i<<"右孩子"<<endl;96 }97 if(i>j)98 cout<<"d"<<j<<"是k"<<j<<"右孩子"<<endl;99 }
程序测试结果如下所示:
参考资料:http://www.cnblogs.com/lpshou/archive/2012/04/26/2470914.html
- 算法导论第15章 动态规划-最优二叉查找树
- 算法导论 ch15 动态规划 最优二叉查找树
- 【算法导论】动态规划之最优二叉查找树
- 算法导论-第15章-动态规划-15.4 最优二叉搜索树
- 算法导论:第15章 动态规划_5最优二叉搜索树
- 最优二叉查找树(动态规划算法实现) 算法导论216
- 算法导论学习笔记(10)——动态规划之最优二叉查找树
- 算法导论之动态规划(最长公共子序列和最优二叉查找树)
- 《算法导论》笔记 第15章 15.5 最优二叉查找树
- 动态规划之最优二叉搜索树(算法导论)
- 【算法导论】动态规划之“最优二叉搜索树”
- 算法导论之动态规划:最优二叉搜索树
- 算法导论第15章 最优二叉树
- 【算法学习】最优二叉查找树(动态规划)
- 动态规划算法—最优二叉查找树
- 【算法学习】最优二叉查找树(动态规划)
- 【算法学习】最优二叉查找树(动态规划)
- 【算法学习】最优二叉查找树(动态规划)
- 牛刀小试 - 趣谈Java中的异常处理
- Spring兩大特色IoC和AOP
- webviewv36 支持的 Remote Debugging 特性以及与 appium 的关系
- 微服务化架构演进与人员组织
- 在Spring下集成ActiveMQ
- 算法导论第15章 动态规划-最优二叉查找树
- 水仙花数(20)
- TTTTTCCCCCPPPPP MARK 连包
- Spring 的 IOC原理
- Codeforces 4C Registration system MAP和hash的简单应用
- 如何处理点击窗口后窗口缓慢展开或者缩小?
- iOS之自带的JSON解决方案NSJSONSerialization
- 算法导论第15章 动态规划-总结
- matlab画图,在图中标出字母