Counting Words(句子切割)

来源:互联网 发布:美国知乎quora评价中国 编辑:程序博客网 时间:2024/06/07 09:15

Input some English sentences, count and print the numbers of all the words and each different words.

/** * Created by 孙月晴 on 2017/7/18. */import java.util.Scanner;import java.util.HashMap;import java.util.StringTokenizer;import java.util.Set;public class WordCount {    public static void main(String[] args) {        System.out.println("input english sentences:");        Scanner in = new Scanner(System.in);        String sentances = in.nextLine();        HashMap<String,Integer> hm = new HashMap<String,Integer>();        StringTokenizer itr = new StringTokenizer(sentances);        System.out.println("totoal numbers:"+itr.countTokens());        while (itr.hasMoreTokens()) {            String word= itr.nextToken();            if (!hm.containsKey(word)){                hm.put(word, 1);            }else{                hm.put(word,hm.get(word).intValue()+1);            }        }        Set<String> keys = hm.keySet();        for (String str : keys) {            System.out.println(str+":"+hm.get(str));        }    }}

运行结果:
运行结果

缺点:不能区分标点符号
补充:
StringTokenizer是字符串分隔解析类型,属于:Java.util包。

1.StringTokenizer的构造函数
StringTokenizer(String str):构造一个用来解析str的StringTokenizer对象。java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。
StringTokenizer(String str,String delim):构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符。
StringTokenizer(String str,String delim,boolean returnDelims):构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符,同时,指定是否返回分隔符。
2.StringTokenizer的一些常用方法
说明:
1.所有方法均为public;
2.书写格式:[修饰符] <返回类型><方法名([参数列表])>
int countTokens():返回nextToken方法被调用的次数。
boolean hasMoreTokens():返回是否还有分隔符。
boolean hasMoreElements():返回是否还有分隔符。
String nextToken():返回从当前位置到下一个分隔符的字符串。
Object nextElement():返回从当前位置到下一个分隔符的字符串。
String nextToken(String delim):与4类似,以指定的分隔符返回结果。

原创粉丝点击