1319 单词统计

来源:互联网 发布:淘宝pc端首页大小 编辑:程序博客网 时间:2024/06/07 05:38
描述

         给定一段文章,每行不超过1000个字符,统计文章中每个单词出现的频率,忽略大小写差异。

注意:单词的不同形态看做是不同的单词,不考虑连字符,所有非大小写字母都视为只起到分割作用。

输入

         第一行为一个整数T,表示数据的组数。

         对于每组数据以一个独占一行的句号('.')结束。

输出

         对于每组测试数据:

第一行为一个整数n表示文章中出现的单词的总数;

接下来n行按字母序从小到大输出文章中出现的单词(全部以大写字母表示)和出现的频数。

样例输入
2
Hello World!
.
Abc abc-cde aa1bb2cc3 aas’ (test)...
.
样例输出
2
HELLO 1
WORLD 1
7
AA 1
AAS 1
ABC 2
BB 1
CC 1
CDE 1
TEST 1



此题是简单的统计,然后排序,但要注意以下几点:

首先, 每组数据没说只有一行, 只是说每一行不超过1000个字符, 所以一行一行读, 直到读到一行是'.'结束
第二, 当一行的最后一个字符是字母的时候, 你没有处理这最后一个单词, 比如这一行是"ABC.ABC", 那么结果应该是ABC 2, 但是你的程序会输出ABC 1, 因为你没处理最后一个单词ABC, 原因是因为你只有当出现不是字母的时候才处理前面一个单词, 但是结尾如果就是字母那么就出错了



#include <stdio.h>#include <string.h>int main(){    int t,number;    int i,j;    int k,l;    char a[1000][1001];    int b[1000];    char temp2[1001];    char temp[1001];    int temp3;    int length;    char en[3];    scanf("%d",&number);    getchar();    for(t=1;t<=number;t++)    {        k=0;        l=0;        memset(a,'\0',sizeof(a));        memset(b,0,sizeof(b));        while(true)        {            gets(temp);            if(temp[0] == '.' &&strlen(temp) == 1) { break;}            length=strlen(temp);            for(i=0;i<length;i++)            {                if(temp[i]>='A'&&temp[i]<='Z')                {                    temp2[l++]=temp[i];                }                else if(temp[i]>='a'&&temp[i]<='z')                {                    temp2[l++]=temp[i]-32;                }                else                {                    temp2[l]='\0';                    if(l==0) continue;                    for(j=0;j<k;j++)                    {                        if(strcmp(a[j],temp2)==0)                        {                            b[j]++;                            break;                        }                    }                    if(j==k)                    {                        strcpy(a[j],temp2);                        b[j]++;                        k++;                    }                    l=0;                }            }            temp2[l]='\0';            if(l==0) continue;            for(j=0;j<k;j++)            {                if(strcmp(a[j],temp2)==0)                {                    b[j]++;                    break;                }            }            if(j==k)            {                strcpy(a[j],temp2);                b[j]++;                k++;            }            l=0;        }        for(i=0;i<k;i++)            for(j=i+1;j<k;j++)            {                if(strcmp(a[i],a[j])>0)                {                    strcpy(temp2,a[j]);                    temp3=b[j];                    strcpy(a[j],a[i]);                    b[j]=b[i];                    strcpy(a[i],temp2);                    b[i]=temp3;                }            }        printf("%d\n",k);        for(i=0;i<k;i++)        {            printf("%s %d\n",a[i],b[i]);        }    }    return 0;}



原创粉丝点击