问题描述如下: 有2.5亿个整数(这2.5亿个整数存储在一个数组里面,至于数组是放在外存还是内存,没有进一步具体说明); 要求找出这2.5亿个数字里面,不重复的数字的个数; 另外,可用的内存限定为600M; 要求算法尽量高效,最优;

来源:互联网 发布:美工刀架图片 编辑:程序博客网 时间:2024/05/16 18:33

问题描述如下:
有2.5亿个整数(这2.5亿个整数存储在一个数组里面,至于数组是放在外存还是内存,没有进一步具体说明);
要求找出这2.5亿个数字里面,不重复的数字的个数
另外,可用的内存限定为600M;
要求算法尽量高效,最优;

 

解决方案:

 

其实分两次算,先算<0部分再算>0部分
则每次统计的数的个数为2^31
以512的内存,每个数以2bit的空间就能存储足够的信息了

1,申请512M内存,作为一个数是否存在的标记flag,全清0
2,设置记数器 count,清0
3,读入一个数,如果>=0则查看相应flag:如果为0,flag置1,count加1;如果为1,flag置2,count减1;如果为2,不处理
4,重复3,直到所有整数处理完毕
5, 清除所有的flag(不清除count)
6,读入一个数,如果<0则查看相应flag:如果为0,flag置1,count加1;如果为1,flag置2,count减1;如果为2,不处理
4,重复6,直到所有整数处理完毕

 

嘿,同志们,俺就没搞清楚18楼的算法:
  A:int的值域有4G之多,使用512M,那512M中的每个BYTE必需要能表示8个数字,而BYTE只能表示最多8位。
  B:如果每BYTE中,需要2bit来表示一个数字的存储,则每BYTE只是4个数字,而512M只能是2G个数字,则对int的值域表示不完。

所以说我没看懂。请各位解答一下。

 

所以需要分大于0和小于0来进行计算,这样也是为了节省空间

原创粉丝点击