划分树
来源:互联网 发布:绝食 水 知乎 编辑:程序博客网 时间:2024/04/29 19:06
对于区间第k大值,除了我们之前介绍的归并树之外。现在要登场的数据结构将比归并树的效率更高,他就是划分树。我们学习归并树的时候了解到:归并树 = 线段树 + 归并排序。那么我们今天要介绍的划分树就是:线段树 + 快排。要说有什么不同的,那就是归并树是从有序到无序,而划分树是从无序到有序。
1、划分树的定义
给定一序列a[1...n],sorted[1...n]为序列从小到大的排列结果。对于划分树的每一个节点(叶子节点除外),其保存的区间[left, right]中小于等于sorted[(left+right)/2]的进入该结点的左子树,否则进入该节点的右子树。如图所示:
从划分树的定义来看,我们不难发现我们使用层状的储存较为方便于是我们,定义划分树的储存结构如下:
const int MAXN = 100001;const int DEEP = 18;//DEEP = ceil(log2(MAXN))+1//ceil是天花板函数,ceil(x)的取值为大于等于x的最小整数using namespace std;typedef struct{ int num[MAXN]; //num记录第k层当前位置的元素的值 int cnt[MAXN]; //cnt记录元素所在区间的当前位置之前进入左孩子的个数}PartitionTree;PartitionTree tree[DEEP];int sorted[MAXN]; //对原来集合中的元素排序后的值。
2、建树
我们知道只要小于等于当前结点的区间中值的数字就进入左子树,否则进入右子树。为了方便我们的查询我们增加一个数组cnt[1...n]用来记录元素所在区间的当前位置之前进入左孩子的个数。根据这些信息我们可以写出建树的代码,如下:
void build(int deep, int lft, int rht){ if(lft == rht) return ; int mid = (lft + rht) >> 1; int scnt = mid - lft + 1; //为了使划分树的每一节点的元素等于区间长度 //我们对于相等的数,就不能全部放到左子树 //只能放一部分给左子树 //下面是计算能够放几个与sorted[mid]相等的数到左子树 for(int i = lft; i <= rht; i++){ if(tree[deep].num[i] < sorted[mid]) scnt--; } int p = lft, r = mid + 1; for(int i = lft, cnt_in_left = 0; i <= rht; i++){ int num = tree[deep].num[i]; //如果小于sorted[mid]或者相等且scnt!=0,那么则放入左子树 if(num < sorted[mid] || (num == sorted[mid] && scnt)){ if(num == sorted[mid]) scnt--; cnt++; tree[deep+1].num[p++] = num; }//否则进入右子树 else tree[deep+1].num[r++] = num; //记录元素所在区间的当前位置之前进入左孩子的个数 tree[deep].cnt[i] = cnt_in_left; } //递归建树 build(deep+1, lft, mid); build(deep+1, mid+1, rht);}
3、查询
划分树的查询只要想明白了,他就很简单。我们在文章前面已经明白了,划分树的定义以及是如何建树的。划分树的查询就是基于我们建树时保存的信息,就是那个cnt数组。如果我们要查找区间[qlft, qrht]内的第k大数,这里就可以小小的是有下cnt数组了。如果tree[deep].cnt[qrht] - tree[deep].cnt[qlft-1] >= K。区间[qlft, qrht]内有超过k个值进入左子树,我们不难发现我们的目标值,已经进入了左子树。反之如果tree[deep].cnt[qrht] - tree[deep].cnt[qlft-1] < K,那么我们的目标值则进入了右子树。于是我们顺藤摸瓜就能找到目标值了,如:
那么,现在对于查询我们还有一个问题要解决,那就是更新查询的区间。什么意思呢,就是原先我们查找的是[4,7]这个区间内的第k大数,那么当我们进入右子树之后,已经不存在[4,7]这个区间了,既然区间都没有了,那么自然k也就变了。经过一番思考,我们可以得到查询代码如下:
//deep为树的深度,[lft, rht]为节点对应的区间//查询区间[qlft, qrht]中的第k大值int query(int deep, int lft, int rht, int qlft, int qrht, int k){ //但区间仅剩下一个点了,显然我们已经找到答案了 if(lft == rht) return tree[deep].num[lft]; int mid = (lft + rht) >> 1; //left表示区间[lft, qlft-1]中进入左子树中的元素个数 //sum_in_left表示区间[qlft, qrht]进入左子树的元素个数 //当查询区间的左边界qlft等于结点区间的左边界lft时, //left = 0, sum_in_left = tree[deep].cnt[qrht] int left = 0, sum_in_left = tree[deep].cnt[qrht]; //当他们不重叠的时候 //那么left=tree[deep].cnt[qlft-1],sum_in_left=tree[deep].cnt[qrht]-tree[deep].cnt[qlft-1] //至于为什么要分情况讨论,就留给读者慢慢思考了 if(qlft != lft){ left = tree[deep].cnt[qlft-1]; sum_in_left -= left; } //目标值在左子树 if(sum_in_left >= k){ int new_qlft = lft + left; int new_qrht = new_qlft + sum_in_left - 1; return query(deep+1, lft, mid, new_qlft, new_qrht, k); } //目标值在右子树 else{ int a = qlft - lft - left; int b = qrht - qlft - sum_in_left; int new_qlft = mid + 1 + a; int new_qrht = new_qlft + b; return query(deep+1, mid+1, rht, new_qlft, new_qrht, k-sum_in_left); }}
3、复杂度
很容易得出时间复杂度为总的时间复杂度为O(n log n)。每一次查询的时间复杂度为O(logn)。空间复杂度为O(n*logn)。显然划分树的时间复杂度要优于归并树。
4、实战演练
pku2104 K-th Number
hdu 2665 Kth number
前两个是基础,后一个是上面所得带sum域的加强版。
hdu 3743 Minium_Number
附上pku2104的代码:
#include <cstdio>#include <algorithm>using namespace std;const int MAXN = 100000 + 1;const int DEEP = 18;typedef struct{ int num[MAXN]; int cnt[MAXN];}PartitionTree;PartitionTree tree[DEEP];int sorted[MAXN];void build(int deep, int lft, int rht){ if(lft == rht) return ; int mid = (lft + rht) >> 1; int key = sorted[mid]; int scnt = mid - lft + 1; for(int i = lft; i <= rht; ++i){ if(tree[deep].num[i] < key) --scnt; } int p = lft-1, r = mid; for(int i = lft, cnt = 0; i <= rht; ++i){ int num = tree[deep].num[i]; if(num < key || (num == key && scnt)){ if(num == key) --scnt; ++cnt; tree[deep+1].num[++p] = num; } else tree[deep+1].num[++r] = num; tree[deep].cnt[i] = cnt; } build(deep+1, lft, mid); build(deep+1, mid+1, rht);}int query(int deep, int lft, int rht, int qlft, int qrht, int k){ if(lft == rht) return tree[deep].num[lft]; int mid = (lft + rht) >> 1; int left = 0, sum_in_left = tree[deep].cnt[qrht]; if(lft != qlft){ left = tree[deep].cnt[qlft-1]; sum_in_left -= left; } if(sum_in_left >= k){ int new_qlft = lft + left; int new_qrht = new_qlft + sum_in_left - 1; return query(deep+1, lft, mid, new_qlft, new_qrht, k); } else{ int a = qlft - lft - left; int b = qrht - qlft - sum_in_left; int new_qlft = mid + 1 + a; int new_qrht = new_qlft + b; return query(deep+1, mid+1, rht, new_qlft, new_qrht, k-sum_in_left); }}int main(){ int n, m, qlft, qrht, k; scanf("%d%d", &n, &m); for(int i = 1; i <= n; i++){ scanf("%d", &sorted[i]); tree[0].num[i] = sorted[i]; } sort(sorted+1, sorted+1+n); build(0, 1, n); while(m--){ scanf("%d%d%d", &qlft, &qrht, &k); printf("%d\n", query(0, 1, n, qlft, qrht, k)); } return 0;}
- 划分树
- 【划分树】
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 划分树
- 似物性检测——linux下运行objectness-v2.2并分析源码(pami2012论文)
- Python数据分析学习笔记一
- ERROR 1045 (28000): Access denied for user...错误的解决
- hdu2795Billboard
- boost::shared_ptr:传值还是传引用?
- 划分树
- 学习笔记之深入浅出MFC 第8章 C++重要性质----基类与派生类:谈继承(Inheritance)
- keras代码阅读-Activition层
- Java transient关键字
- CSS3圆角border-radius属性详解
- 汇编语言学习第九章-转移指令的原理
- uWSGI+Nginx+Django安装和配置
- 剑指offer-面试题54:表示数值的字符串
- HDU 5656 CA Loves GCD