最小的k个数 剑指office原题
来源:互联网 发布:excel sql 编辑:程序博客网 时间:2024/05/21 12:49
输入n个整数,找出其中最小的K个数
问题:输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4,。
分析:
同样最直接的简单方法就是先给这n个整数先排序,排序之后位于最前面的K个数就是最小的K个数,结合考虑到的边界条件和错误处理。简单编码如下:
importjava.util.ArrayList;
importjava.util.Collections;
publicclass Solution {
public ArrayListGetLeastNumbers_Solution(int [] input, int k) {
if(input.length<=0||k<=0||input.length
return newArrayList();
ArrayList list=newArrayList();
ArrayList newlist=newArrayList();
for(int i=0;i
list.add(input[i]);
}
if(input.length==k)
return list;
Collections.sort(list);
for(int i=0;i<=k-1;i++){
newlist.add(list.get(i));
}
return newlist;
}
}
但是算法复杂度为O(nlogn),试着优化,提出更快的算法,如果基于数组的第K个数字来调整,使得比第K个数字小的所有数字位于数组的左边,比第K个数字大的所有数字位于数组的右边。这样调整后。位于数组左边的K个数字就是最小的K个数字(这K个数字不一定是排序的)。基于这个思路,算法复杂度降为了O(n),编码如下:
importjava.util.ArrayList;
publicclass Solution {
public ArrayListGetLeastNumbers_Solution(int [] input, int k) {
if(input.length<=0||k<=0||input.length
return newArrayList();
int start=0,end=input.length-1;
int index=Partition(input,start,end);
while(index!=k-1){
if(index>k-1){
end=index-1;
index=Partition(input,start,end);
}else{
start=index+1;
index=Partition(input,start,end);
}
}
ArrayList list=newArrayList();
for(int i=0;i
list.add(input[i]);
return list;
}
public static int Partition(int[] input,intstart,int end){
int pivot=(int)(Math.random()*(end-start)+start);
swap(input[pivot],input[end]);
int small=start-1;
for(pivot=start;pivot
if(input[pivot]
small++;
if(small!=pivot)
swap(input[pivot],input[small]);
}
}
small++;
swap(input[small],input[end]);
return small;
}
private static void swap(int x,int y){
int temp=x;
x=y;
y=temp;
}
}
但是在通过时有错误,不明白错在哪里,正确运行无错的代码如下:
importjava.util.ArrayList;
publicclass Solution {
public ArrayListGetLeastNumbers_Solution(int [] input, int k) {
ArrayList aList = new ArrayList();
if(input.length == 0 || k >input.length || k <= 0)
return aList;
int low = 0;
int high = input.length-1;
int index =Partition(input,k,low,high);
while(index != k-1){
if (index > k-1) {
high = index-1;
index =Partition(input,k,low,high);
}else{
low = index+1;
index =Partition(input,k,low,high);
}
}
for (int i = 0; i < k; i++)
aList.add(input[i]);
return aList;
}
int Partition(int[] input,int k,int low,inthigh){
int pivotkey = input[k-1];
swap(input,k-1,low);
while(low < high){
while(low < high &&input[high] >= pivotkey)
high--;
swap(input,low,high);
while(low < high &&input[low] <= pivotkey)
low++;
swap(input,low,high);
}
return low;
}
private void swap(int[] input, int low, inthigh) {
int temp = input[high];
input[high] = input[low];
input[low] = temp;
}
}
进一步思考,如果数据很大,面对海量数据时,能不能使得时间复杂度较低且快速完成任务?我们可以先创建一个大小为K的数据容器来存储最小的K个数字,接下来我们每次从输入的n个整数中读入一个数。如果容器中已有的数字少于K个,则直接把这次读入的整数放入到容器中;如果容器中已有K个数字了,就说明容器已满,此时我们不能再插入新的数字而只能替换已有的数字。当容器满了,我们要做三件事:一是在K个整数中找到最大数;二是有可能在这个容器中删除最大数;三是有可能插入一个新的数。找到已有的K个数中的最大值,然后拿这次待插入的整数和最大值进行比较。如果待插入的值比当前已有的最大值小,则用这个数替换当前已有的最大值;如果待插入的值比当前已有的最大值还要大,那么这个数不可能是最小的K个整数之一,我们抛弃这个整数。选择不同的二叉树来实现这个容器,自然想到的就是最大堆或红黑树。按照该方法编写代码如下:
importjava.util.ArrayList;
importjava.util.Iterator;
importjava.util.TreeSet;
publicclass Solution {
public static ArrayListGetLeastNumbers_Solution(int[] input, int k) {
ArrayList leastNum = newArrayList();
if (input == null || input.length <1 || k < 1 || k > input.length)
return leastNum;
TreeSet kSet = newTreeSet();
for (int i = 0; i < input.length;i++) {
if (kSet.size() < k) {
kSet.add(input[i]);
} else {
if (input[i] < kSet.last()){
kSet.remove(kSet.last());
kSet.add(input[i]);
}
}
}
Iterator it =kSet.iterator();
while (it.hasNext()) {
leastNum.add(it.next());
}
return leastNum;
}
}
比较后两种改进的算法,如下:
- 最小的k个数 剑指office原题
- 最小的K个数
- 最小的K个数
- 最小的K个数
- 最小的k个数
- 最小的k个数
- 最小的k个数
- 最小的k个数
- 最小的k个数
- 最小的k个数
- 最小的K个数
- 最小的k个数
- 最小的K个数
- 最小的K个数
- 最小的K个数
- 最小的K个数
- 最小的K个数
- 最小的k个数
- 选择排序
- LCA模板 Tarjan
- Java 获取文件的MIME类型
- java 命令执行jar 或 class main
- android studio httpclient
- 最小的k个数 剑指office原题
- Java通过QQ邮箱发送邮件
- kmp 模板
- HR面试程序员,一般第一个问题会问什么
- 每天一个linux命令(2):cd命令
- Mybatis:关于动态生成sql语句的一些问题
- Linux下ifconfig不显示ip地址
- Java常见集合框架(十九): Map之Map、AbstractMap、HashMap
- 接口和抽象类有什么区别