面试算法(二十九)最小的k个数
来源:互联网 发布:mac 10.11 升级 10.12 编辑:程序博客网 时间:2024/05/04 12:21
1、题目:输入n个整数,找出其中最小的k个数。
例如输入4、5、1、6、2、7、3、8这8个数字,则最小的4个数字是1、2、3、4。
解法一:
直观的思路是把输入的n个整数排序,排序之后位于最前面的k个数就是最小的k个数。时间复杂度是O(nlogn)。
解法二:
O(n)的算法,只有当我们可以修改输入的数组时可用。
如果基于数组的第k个数字来调整,使得比第k个数字小的所有数字都位于数组的左边,比第k个数字大的所有数字都位于数组的右边。这样调整之后,位于数组中左边的k个数字就是最小的k个数字(这k个数字不一定是排序的)。
void GetLeastNumbers(int* input, int n, int* output, int k){if(input == NULL || output == NULL || k > n || n <= 0 || k <= 0)return;int start = 0;int end = n - 1; int index = Partition(input, n, start, end); while(index != k - 1){ if(index > k-1) { end = index - 1; index = Partition(input, n, start, end); } else { start = index + 1; index = Partition(input, n, start, end); } }for(int i=0; i<k; ++i)output[i] = input[i];}这种思路是有限制的,我们需要修改输入的数组,因为函数Partition会调整数组中数字的顺序。
解法三:O(nlogk)的算法,特别适合处理海量数据。
1)我们可以先创建一个大小为k的数据容器来存储最小的k个数字,接下来我们每次从输入的n个整数中读入一个数。如果容器中已有的数字少于k个,则直接把这次读入的整数放入容器中;如果容器中已有k个数字了,也就是容器已满,此时我们不能再插入新的数字而只能替换已有的数字。
找出这已有的k个数中的最大值,然后拿这次待插入的整数和最大值进行比较。如果待插入的值比当前已有的最大值小,则用这个数替换当前已有的最大值;如果待插入的值比当前已有的最大值还要大,那么这个数不可能是最小的k个整数之一,于是我们可以抛弃这个整数。
2)因此容器满了之后,我们要做3件事:一是在k个整数中找到最大数;二是有可能在这个容器中删除最大数;三是有可能要插入一个新的数字。
3)我们用最大堆实现这个数据容器,在最大堆中,根结点的值总是大于它的子树中任意结点的值。于是每次可以在O(1)得到已有的k个数字中的最大值,但需要O(logk)时间完成删除及插入操作。
typedef multiset<int, greater<int> > intSet;typedef multiset<int, greater<int> >:::iterator setIterator;void GetLeastNumbers(const vector<int>& data, intSet& leastNumbers, int k){leastNumbers.clear();if(k < 1 || data.size() < k )return;vector<int>::const_iterator iter = data.begin();for(; iter != data.end(); ++iter){if(leastNumbers.size()) < k)leastNumbers.insert(*iter);else{setIterator iterGreatest = leastNumbers.begin();if(*iter < *(leastNumbers.begin())){leastNumbers.erase(iterGreatest);leastNumbers.insert(*iter);}}}}
这里的最大堆用红黑树实现。红黑树通过把结点分为红、黑两种颜色并根据一些规则确保树在一定程度上是平衡的,从而保证在红黑树中查找、删除和插入操作都只需要O(logk)时间。在STL中set和multiset都是基于红黑树实现的。
- 面试算法(二十九)最小的k个数
- 面试30:最小的K个数(top K问题)
- 最小的K个数(算法)
- (二十二)剑指offer之最小的k个数
- 算法学习(一):寻找最小的k个数
- 算法---寻找最小的k个数
- bfprt算法求最小的k个数
- 算法考题---最小的k个数
- 算法题/最小的k个数
- n个数中的最小的k个数的BFPRT算法
- 最小的K个数
- 最小的K个数
- 最小的K个数
- 最小的k个数
- 最小的k个数
- 最小的k个数
- 最小的k个数
- 最小的k个数
- android四大组件概括
- 自定义JSP标签
- 《TI C2000入门培训》之 第一讲:C2000入门培训介绍[下载]
- android 开发 报错笔记
- Uva-1220-Party at Hali-Bula
- 面试算法(二十九)最小的k个数
- 编译器
- js方式锁定表头
- windows环境下secureCRT链接不上linux虚拟机的解决办法
- macbook连接linux服务器后不能显示matlab桌面[问题]
- Sublime Text 3 安装Package Control
- cocos2dx屏幕适配
- asset与res/raw的区别
- 如何调试代码(h264编解码为例)