java统计文本中英文单词个数
来源:互联网 发布:淘宝达人 app 编辑:程序博客网 时间:2024/05/16 16:58
package com.xasmall.Test;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.IOException;import java.util.Set;import com.google.common.collect.HashMultiset;import com.google.common.collect.Multiset;/* * 处理文本数据,将英文单词分割,统计次数 * 使用正则表达式 * 首先除去所有非英文的字符,然后分割,最后使用guava multiset统计 */public class MapDemo { public static void dealstring(String filename) throws IOException { FileReader fileReader=new FileReader(new File(filename)); BufferedReader bufferedReader=new BufferedReader(fileReader); StringBuffer stringBuffer=new StringBuffer(); String string=null; while((string=bufferedReader.readLine())!=null) { stringBuffer.append(string); } string=stringBuffer.toString(); string=string.replaceAll("[^a-zA-Z\\s+]", ""); String[] strings=string.split("[\\s+,\\.\n]"); Multiset<String> col=HashMultiset.create(); for(String string2:strings) { col.add(string2); } Set<String> minset=col.elementSet(); for(String temp:minset) { System.out.println(temp+"-->"+col.count(temp)); } bufferedReader.close(); fileReader.close(); }}
guava下载
密码:zkci
阅读全文
0 0
- java统计文本中英文单词个数
- 统计文本单词的个数
- 统计文本中英文单词的出现频率
- Java统计单词个数
- python统计文本中单词个数
- 实验4(统计文本单词个数)
- 统计一行文本的单词个数
- 统计文本中每个单词的个数
- 使用单链表统计英文文本单词个数
- c++实现文本中英文单词和汉字字符的统计
- 【Java字符串高效率】统计单词统计个数
- java统计字符串中中英文个数
- java统计字符串中中英文个数
- java统计字符串单词的个数
- 用hadoop统计文本中单词的个数
- 【C语言助教】统计文本中单词的个数!
- 循环-06. 统计一行文本的单词个数(15)
- 循环-06. 统计一行文本的单词个数(15)
- 一元二次方程组膜下解
- Centos7 安装java, python 环境
- Hibernate入门学习(1)----认识ORM及Hibernate
- LeetCode#9-Palindrome Number
- android--关于ViewPropertyAnimator中Rotation/X/Y方法的使用
- java统计文本中英文单词个数
- 进程保活
- Git简介
- 实验教学内容(16课时)实验2选择语句练习
- 设计模式-建造者模式
- ipv6
- Git的诞生
- 开源项目fork code如何持续Merge回Master
- mongodb服务器管理