面试算法(二十九)最小的k个数

来源:互联网 发布:mac 10.11 升级 10.12 编辑:程序博客网 时间:2024/05/04 12:21

1、题目:输入n个整数,找出其中最小的k个数。

例如输入4、5、1、6、2、7、3、8这8个数字,则最小的4个数字是1、2、3、4。

解法一:

直观的思路是把输入的n个整数排序,排序之后位于最前面的k个数就是最小的k个数。时间复杂度是O(nlogn)。


解法二:

O(n)的算法,只有当我们可以修改输入的数组时可用。

如果基于数组的第k个数字来调整,使得比第k个数字小的所有数字都位于数组的左边,比第k个数字大的所有数字都位于数组的右边。这样调整之后,位于数组中左边的k个数字就是最小的k个数字(这k个数字不一定是排序的)。

void GetLeastNumbers(int* input, int n, int* output, int k){if(input == NULL || output == NULL || k > n || n <= 0 || k <= 0)return;int start = 0;int end = n - 1;    int index = Partition(input, n, start, end); while(index != k - 1){ if(index > k-1)          {              end = index - 1;              index = Partition(input, n, start, end);          }          else          {              start = index + 1;              index = Partition(input, n, start, end);          } }for(int i=0; i<k; ++i)output[i] = input[i];}
这种思路是有限制的,我们需要修改输入的数组,因为函数Partition会调整数组中数字的顺序。


解法三:O(nlogk)的算法,特别适合处理海量数据。

1)我们可以先创建一个大小为k的数据容器来存储最小的k个数字,接下来我们每次从输入的n个整数中读入一个数。如果容器中已有的数字少于k个,则直接把这次读入的整数放入容器中;如果容器中已有k个数字了,也就是容器已满,此时我们不能再插入新的数字而只能替换已有的数字。

找出这已有的k个数中的最大值,然后拿这次待插入的整数和最大值进行比较。如果待插入的值比当前已有的最大值小,则用这个数替换当前已有的最大值;如果待插入的值比当前已有的最大值还要大,那么这个数不可能是最小的k个整数之一,于是我们可以抛弃这个整数。

2)因此容器满了之后,我们要做3件事:一是在k个整数中找到最大数;二是有可能在这个容器中删除最大数;三是有可能要插入一个新的数字。

3)我们用最大堆实现这个数据容器,在最大堆中,根结点的值总是大于它的子树中任意结点的值。于是每次可以在O(1)得到已有的k个数字中的最大值,但需要O(logk)时间完成删除及插入操作。

typedef multiset<int, greater<int> >  intSet;typedef multiset<int, greater<int> >:::iterator setIterator;void GetLeastNumbers(const vector<int>& data, intSet& leastNumbers, int k){leastNumbers.clear();if(k < 1 || data.size() < k )return;vector<int>::const_iterator iter = data.begin();for(; iter != data.end(); ++iter){if(leastNumbers.size()) < k)leastNumbers.insert(*iter);else{setIterator iterGreatest = leastNumbers.begin();if(*iter < *(leastNumbers.begin())){leastNumbers.erase(iterGreatest);leastNumbers.insert(*iter);}}}}

这里的最大堆用红黑树实现。红黑树通过把结点分为红、黑两种颜色并根据一些规则确保树在一定程度上是平衡的,从而保证在红黑树中查找、删除和插入操作都只需要O(logk)时间。在STL中set和multiset都是基于红黑树实现的。






0 0
原创粉丝点击