《编程珠玑》--第二章 啊哈!算法
来源:互联网 发布:linux gcc 4.8.5 编辑:程序博客网 时间:2024/05/18 21:10
三个问题:
A题:给定一个最多包含40亿个随机排列的32位整数的顺序文件,找出一个不在文件中的32位整数。
1、在文件中至少存在这样一个数?
2、如果有足够的内存,如何处理?
3、如果内存不足,仅可以用文件来进行处理,如何处理?
答案:
1、32位整数,包括-2146473648~~2146473647,约42亿个整数,而文件中只有40亿个,必然有整数少了。
2、如果采用位数思想来存放,则32位整数最多需要占用43亿个位。约512MB的内存空间 (2`32/8=512MB)
可以采用前一章的位处理方法。然后判断每个int是否等于-1。因为-1的二进制表示是全1的。如果不等于-1。那么说明某一位没有置位。需要进行处理。
3、内存不足,可以采用如下思想:
按最高位分为两段,没有出现的那个数,肯定在比较小的段里面。
如果比较少的段最高位为1,那么缺少的那个数的最高位也为1.
如果比较少的段最高位为0,那么少的那个数的最高位也是0.
依次按以上方法去处理每个位。
算法复杂度为O(n)。每次处理的部分都是上一次的一半。累加之后是O(n).
思想与找第K小数的思想是一样的。只不过在这里是有一个自动分割的过程。而找第k小数的时候,是随机找一个数。
为了验证思想这里写了段C代码。
- int get_lost(int *a, int *b, int *c, int alen, int bit)
- {
- int re = 0, v = 0, biter = 0, *t, citer, i = 0;
- if (!a || !b || alen ==(unsigned long)( (1<< bit))) return -1; //哪个数与最多可能拥有个数相等的时候,直接返回了。
- while (bit--)
- {
- v = (1 << bit);
- for (biter = citer = i = 0; i < alen; ++i)
- {
- if (a[i] & (1 << bit)) b[biter++] = a[i];
- else c[citer++] = a[i];
- }
- if (biter <= citer)
- {
- re += v;
- t = a; a = b; b = t;
- alen = biter;
- }
- else
- {
- t = a; a = c; c = t;
- alen = citer;
- }
- }
- return re;
- }
re表示最后缺少的那个数。
B题:字符串循环移位比如abcdef 左移三位,则变成defabc
_rev(0, i)
_rev(i, len)
_rev(0, len)
- static void _res(char *a, int n)
- {
- int i = 0, j = n - 1;
- char t;
- while (i < j)
- {
- t = a[i]; a[i] = a[j]; a[j] = t;
- ++i; --j;
- }
- }
- char *rever(char *a, int n, int len)
- {
- int i, j;
- if (!a || !n) return a;
- _res(a, n);
- _res(a + n, len - n);
- _res(a, len);
- return a;
- }
算法如下:单词按照字母进行排序,单词间进行排序,这样相同标识的单词聚集到一起
这里用C++来写了。
- void gen_label(vector<string> &dict, map<string, vector<string> >&rec)
- {
- for (int i = 0; i < dict.size(); ++i)
- {
- string line = dict[i];
- sort(line.begin(), line.end());
- rec[line].push_back(dict[i]);
- }
- for (map<string, vector<string> >::iterator iter = rec.begin();iter != rec.end(); ++iter)
- {
- copy((iter->second).begin(), (iter->second).end(), ostream_iterator<string>(cout , " "));
- cout << endl;
- }
- }
2.6习题
1 、如果没有时间进行预处理,那么可以找到这个单词的标识符,然后扫描这个字典,标识符相同的输出。
如果可以预处理,那么可以先预处理,用gen_label函数进行预处理则可。
2、[关键看清楚:顺序文件--->已经排好序的; 4300 000 000 大于2`32]
按照二分法,按照最大值/2 分成两部分,取较大的部分则可。实际上如果要形成严格地每次下降一半,那么需要如下处理:
1)如果最多有max个整数,比如对于有4个bit位的整形数。最多有16个数。
2)如果给了32个数,实际上只需要取前面17个数就可以了,后面的不要了。(这17个数中一定有重复的数,只需要找出一个重复的就可以)
3)把这17个数按首位分为两堆,按理说一边是8,一边是9。如果发现分的一边比9还要多出几个。多出来的也不用看了。接下来处理9个的情况。
4)这样在线性时间内一定可以找到一个重复的数
通过这种策略,可以保证最终可以找到那个重复的数。
5、如果是自己写函数那么就是前面所写的_rev函数。
如果是要调用rever()函数。那么方法如下。
- int main(void)
- {
- int n, len;
- char *c = NULL;
- while (scanf("%s", a) != EOF)
- {
- len = strlen(a);
- c = a;
- ++len;
- while (len--)
- {
- rever(c, len - 1, len);
- ++c;
- }
- printf("%s\n", a);
- }
- return 0;
- }
用hash,
hash_map<int, hash_set<string> > rec;
8、把最小的K个数找到O(nlogk),然后看这个K个数的和是否小于t.
9、搜索次数C > nlgn/ (n - lgn)
- 《编程珠玑》--第二章 啊哈!算法
- 【编程珠玑】第二章:啊哈,算法
- 《编程珠玑》第二章——“啊哈!算法”
- 编程珠玑_第二章_啊哈 算法
- 编程珠玑:第二章 啊哈,算法三个问题
- 编程珠玑 ~~ 啊哈! 算法
- 编程珠玑--啊哈!算法
- 《编程珠玑》习题练习In Python——第二章 啊哈!算法
- 编程珠玑 第二章 算法
- 【读薄《编程珠玑》】贰 啊哈!算法
- 第二章 啊哈!算法
- 第二章 啊哈!算法
- 《编程珠玑》 第二章 算法 习题
- 编程珠玑-第二章旋转算法篇
- 编程珠玑第二章旋转算法
- 编程珠玑第二章的算法实现
- 变位词算法(编程珠玑第二章)
- 编程珠玑之第二章:杂耍算法
- JAVA annotation入门
- deletedc和releasedc
- 《Android系统学习》第七章:Android4.0.1在ubuntu12.04编译的一个问题
- 常用的宽字符函数
- 建立有效IT治理的策略和方法
- 《编程珠玑》--第二章 啊哈!算法
- 简单调试技术
- 成员函数指针作为参数传递给其他函数和普通函数指针的传递
- Activity与Intent
- linux下纯C md5
- DEDECMS 自定义调出图片大小
- Java格式化数字
- 程序员的本质
- 终极解决方案 at org.apache.jsp.index_jsp._jspInit(index_jsp.java:22) 报空指针