作业,统计单词出现频率
来源:互联网 发布:淘宝收到货怎么退货 编辑:程序博客网 时间:2024/04/29 01:02
源代码:
#include<iostream>
#include<iomanip>
#include<time.h>
using namespace std;
#define M 20000
//文章单词个数
typedef struct
{
char danci[19];//储存单词
int count;//记录单词个数,后面出现几次
}sq;
void main()
{
double start, finish;
start = (double)clock();
sq word[M];
sq t_word;
double s, f;
int K, n = 0, i, j;
char infile[10];
s = (double)clock();
cout << "***********请输入文件路径:***********" << endl;
cin >> infile;//文件路径输入
f = (double)clock();//
cout << "输入文件路径的时间:" << (f - s) / 1000 << "s" << endl;
FILE *fp;
char ch;
//fp=fopen("d://pro.txt","r");
if ((fp = fopen(infile, "r")) == NULL)
{
cout << "无法打开文件!" << endl;
exit(0);
}
s = (double)clock();
while (!feof(fp))
{
ch = getc(fp);
if (ch == ' ' || ch == 10)
{//虑空
continue;
}
if ((ch >= 'a'&&ch <= 'z') || (ch >= 'A'&&ch <= 'Z')) //发现一个单词
{
K = 0;
t_word.count = 1;
while ((ch >= 'a'&&ch <= 'z') || (ch >= 'A'&&ch <= 'Z') || (ch == '\''))
{
if (ch >= 'A'&&ch <= 'Z')
ch += 32;//转换成小写
t_word.danci[K++] = ch;
ch = getc(fp);
}
t_word.danci[K++] = '\0';
//一个单词结束
j = n;
for (i = 0; i<j; i++) //与前面的单词比较
{
if (strcmp(t_word.danci, word[i].danci) == 0)
{
word[i].count++;
break;
}
}
if (n == 0 || i == j)
{
word[n] = t_word;
n++;
}
}
}
f = (double)clock();
cout << "读文件,分出单词并统计的时间:" << (f - s) / 1000 << "s" << endl;
s = (double)clock();
//输出频率最高的十个单词
sq frequency_max[11];
sq temp;
for (i = 0; i<10; i++)
{
frequency_max[i] = word[i];//初始化频率最高的十个单词为前十个单词
}
//前十个排序
for (j = 0; j<10; j++)
for (i = 0; i<10 - j; i++)
if (frequency_max[i].count<frequency_max[i + 1].count)
{
temp = frequency_max[i];
frequency_max[i] = frequency_max[i + 1];
frequency_max[i + 1] = temp;
}
for (i = 10; i<n; i++)
{
if (frequency_max[9].count<word[i].count)
{
int a = 8;
while (frequency_max[a].count<word[i].count&&a >= 0)
{
a--;
}
for (j = 9; j>a + 1; j--)
{
frequency_max[j] = frequency_max[j - 1];
}
if (a<0)
frequency_max[0] = word[i];
else
frequency_max[j] = word[i];
}
}
f = (double)clock();
cout << "冒泡排序,搜索频率最高的10个单词的时间:" << (f - s) << "ms" << endl;
for (i = 0; i<10; i++)
{
cout << setiosflags(ios::left) << setw(10) << frequency_max[i].danci << frequency_max[i].count << endl;
}
finish = (double)clock();
cout << "总运行时间:" << (finish - start) / 1000 << "s" << endl;
}
截图:
性能分析:
- 作业,统计单词出现频率
- Java统计单词出现频率
- 软件工程作业之统计单词出现频率前10 的单词
- 利用树统计单词出现的频率
- 统计文件中单词出现的频率
- 统计英文文本单词出现频率
- 统计文本中英文单词的出现频率
- Python 统计文章单词出现频率
- 统计一篇短文中单词出现频率
- Linux作业(三)-shell统计某文章中出现频率最高的N个单词并排序输出出现次数
- 统计单词频率-map
- Java统计单词频率
- 统计一TXT文档中单词出现频率,输出频率最高的10个单词
- 统计一篇文章中单词出现的频率
- 统计文章出现频率最高的单词 2011211554
- 统计历年6级真题及答案中单词出现频率
- STL统计英文中单词出现频率的问题
- 个人项目:统计文本中的单词出现频率
- 关于Android 定位,超级简单定义
- 视图控制器-(多视图跳转的两种方式)
- 快排及应用
- 色彩专题(PS的颜色理论)
- 计算机程序设计竞赛艺术(单调栈扩展)
- 作业,统计单词出现频率
- 第七章 7.6节练习
- SpringMVC深度探险收藏
- SOPJ第一题
- jd-eclipse 的安装和使用(最新版的)
- cpu信息
- Codeforces Round #274 (Div. 2)
- C/C++程序员必须熟练应用的开源项目 -- 转
- 这条路,真的可以走下去-------Day91