1亿个int数从小到大排序列出第1万到第10万个数

来源:互联网 发布:网络调研计划书模板 编辑:程序博客网 时间:2024/05/21 08:57

1亿个int数从小到大排序列出第1万到第10万个数
这是某天师弟提出的一个面试题,本来还算是比较简单的,但是太久脱离算法,让我顿时没有一个更好的解决方案,于是被人用桶排序直接鄙视了一下。当时因为没提出一个很好的解决方案,还是落败了,只能说桶排序的效率还是满高的。但是我深知,这题肯定不能就这么排序解决。后来由于工作的原因,也把这事给淡忘了。今天无意翻起当时的草稿,遂想起应该用分段的做法。当时也有某师兄提过,但是他没有描述过程,于是被人遗忘。
先分析这题的做法如果用桶排序的方式,需要用O(NM)的时间复杂度,写成链表最少需要O(N)的空间辅助。
这里是一亿个INT数,所以我们假设不考虑内存空间,直接用桶存,要用个2^32的时间和空间应该是最好的情况了

但是其实这道题的精髓部分在于列出第1万到第10万个数,直觉告诉我如果你把他全部都排一遍的话,那么可能直接被刷了。
后来想到分段的方式,先用1W的辅助空间,用O(N)的时间,这里的N = 1亿挑出前1W个数。(这1W空间可以标记数据的位置)
再用9W的辅助空间,O(N)的时间,挑出1W-10W的数。现在随便用个归并排序、堆排序什么的,可以在O(N*LOGN)时间内计算出来,这里的N = 9W。这样算出来的全程时间算成具体单位时间是2亿多一点。辅助空间最好情况为10W,具体根据9W个数排序方式。

这样算下来,时间上比直接桶排序是要快一倍,辅助空间上就要小太多了。

 

补充,后来在别人的提醒下,想到其实可以用O(N)的时间 (N = 1亿) 直接挑出前10W的数,然后再将10W数排序,时间复杂度为:O(N*LOGN) 这里N = 10W,然后再用O(N)挑出前1W个数,最后得到的便是解。
时间复杂度在1亿多一点
空间复杂度在10W左右