百度编程竞赛题目

来源:互联网 发布:中国的政治体系 知乎 编辑:程序博客网 时间:2024/05/05 23:19

第一题 连续正整数(10分)

题目描述:一个正整数有可能可以被表示为n(n>=2)个连续正整数之和,如:
15=1+2+3+4+5
15=4+5+6
15=7+8
请编写程序,根据输入的任何一个正整数,找出符合这种要求的所有连续正整数序列
。 输入数据:一个正整数,以命令行参数的形式提供给程序。 输出数据:在标准输
出上打印出符合题目描述的全部正整数序列,每行一个序列,每个序列都从该序列的最小
正整数开始、以从小到大的顺序打印。如果结果有多个序列,按各序列的最小正整数的大
小从小到大打印各序列。此外,序列不允许重复,序列内的整数用一个空格分隔。如果没
有符合要求的序列,输出“NONE”。
例如,对于15,其输出结果是:
1 2 3 4 5
4 5 6
7 8
对于16,其输出结果是:
NONE
评分标准:程序输出结果是否正确。


第二题 重叠区间大小(20分)

题目描述:请编写程序,找出下面“输入数据及格式”中所描述的输入数据文件中最大
重叠区间的大小。
对一个正整数n,如果n在数据文件中某行的两个正整数(假设为A和B)之间,即A<=n
<=B或A>=n>=B,则n属于该行;如果n同时属于行i和j,则i和j有重叠区间;重叠区间的大
小是同时属于行i和j的整数个数。
例如,行(10 20)和(12 25)的重叠区间为[12 20],其大小为9;行(20 10)和(
12 18)的重叠区间为[10 12],其大小为3;行(20 10)和(20 30)的重叠区间大小为1。
输入数据:程序读入已被命名为input.txt的输入数据文本文件,该文件的行数在1到1
,000,000之间,每行有用一个空格分隔的2个正整数,这2个正整数的大小次序随机,每个
数都在1和2^32-1之间。(为便于调试,您可下载测试input.txt文件,实际运行时我们会
使用不同内容的输入文件。) 输出数据:在标准输出上打印出输入数据文件中最大重叠
区间的大小,如果所有行都没有重叠区间,则输出0。 评分标准:程序输出结果必须正
确,内存使用必须不超过256MB,程序的执行时间越快越好。


第三题 字符串替换(30分)

题目描述:请编写程序,根据指定的对应关系,把一个文本中的字符串替换成另外的字
符串。 输入数据:程序读入已被命名为text.txt和dict.txt的两个输入数据文本文件
,text.txt为一个包含大量字符串(含中文)的文本,以whitespace为分隔符;dict.txt
为表示字符串(s1)与字符串(s2)的对应关系的另一个文本(含中文),大约在1万行左
右,每行两个字符串(即s1和s2),用一个/t或空格分隔。dict.txt中各行的s1没有排序
,并有可能有重复,这时以最后出现的那次s1所对应的s2为准。text.txt和dict.txt中的
每个字符串都可能包含除whitespace之外的任何字符。text.txt中的字符串必须和dict.t
xt中的某s1完全匹配才能被替换。(为便于调试,您可下载测试text.txt和dict.txt文件
,实际运行时我们会使用不同内容的输入文件。) 输出数据:在标准输出上打印text.
txt被dict.txt替换后了的整个文本。 评分标准:程序输出结果必须正确,内存使用越
少越好,程序的执行时间越快越好。


第四题 低频词过滤(40分)

题目描述:请编写程序,从包含大量单词的文本中删除出现次数最少的单词。如果有多
个单词都出现最少的次数,则将这些单词都删除。 输入数据:程序读入已被命名为cor
pus.txt的一个大数据量的文本文件,该文件包含英文单词和中文单词,词与词之间以一个
或多个whitespace分隔。(为便于调试,您可下载测试corpus.txt文件,实际运行时我们
会使用不同内容的输入文件。) 输出数据:在标准输出上打印删除了corpus.txt中出现
次数最少的单词之后的文本(词与词保持原来的顺序,仍以空格分隔)。 评分标准:
程序输出结果必须正确,内存使用越少越好,程序的执行时间越快越好。

原创粉丝点击