clolumn1: creacking the oyster

来源:互联网 发布:下载格式化工厂软件 编辑:程序博客网 时间:2024/05/22 06:32

上周六开始读编程珠玑了,看完了第一篇。不过现在才写笔记,第一篇的问题其实回过头来想想非常简单,但是对于一个学过数据结构和排序算法又了解不深的人不可能想出来这样的方法吧,反而对于一个没学过排序的人更有可能想到。问题是这样的:

input: a file containing at most n positive integers,each less than n,where n = 107. it is a fatal error if any integer occurs twice in the input.no other data is associated with the integer.

output:a sorted list in increasing order of the input integers.

constraints: at most(roughly) a megabyte of storage is available in main memory.ample disk storage is available.the run time can be at most several minutes;a run time of ten seconds need not be dereased.

我当时真不知道怎么算,看了答案才恍然大悟。不得不惊叹答案的简洁和优雅。感觉自己怎么那么笨了。这个问题其实和大学里点名签到非常类似,老师看谁来了没有会在名册上点名,来了的画个勾,念名字的顺序就是学号的顺序,或者说排序的顺序。看到这你是不是有点顿悟,我们其实并不需要对它进行排序,因为没有重复的数字,我们只要对有的数字做个记录就可以了。但是会有一个问题,一个char型数组需要1个字节保存,而107再乘以1是10兆左右!难道要把数据进行10次交换,显然效率太低。你想到了么?它用的是位,一个字节就可以表示8个数字了,这样算下来可以保存的数字是1024 * 1024 * 8 = 8386608差不多可以一次或者两次保存所有的数据了。然后在将结果输出即可。

那问题的解决方法分为三步,首先将位全部清0,第二部从文件中读出所有数据,有数据的bit[i] = 1,做上标记。最后一步将所有做上标记的数据按顺序输出即可。和大学里老师点名是一个道理的。有两点比较难想,一是使用位,毕竟现在很少使用。二是根据数据不重复最大是107的特性,不用排序算法而用做标记的方法。实在是简洁优雅。

原创粉丝点击