Java实现文本按照自然段落进行切分
来源:互联网 发布:我的世界暮色森林js 编辑:程序博客网 时间:2024/06/08 04:26
package cn.edu.shu.web.test;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.IOException;import java.util.ArrayList;import java.util.Iterator;/** * * <p> * ClassName GetParagraph * </p> * <p> * Description 使用Java完成对一篇文本的自然段落的切分,在此给出了五种文本格式作为示例,对任一种格式,该程序均可以正确切分。 * </p> * * @author TKPad wangx89@126.com * <p> * Date 2015年2月11日 下午1:33:03 * </p> * @version V1.0.0 * */public class GetParagraph { public static void main(String[] args) throws IOException { ArrayList<String> res = new ArrayList<String>();// 段落切分结果 StringBuilder sb = new StringBuilder();// 拼接读取的内容 String temp = null;// 临时变量,存储sb去除空格的内容 // BufferedReader reader = new BufferedReader(new FileReader(new File("C:\\Users\\TKPad\\Desktop\\a.txt"))); // BufferedReader reader= new BufferedReader(new FileReader(new File("C:\\Users\\TKPad\\Desktop\\b.txt"))); // BufferedReader reader= new BufferedReader(new FileReader(new File("C:\\Users\\TKPad\\Desktop\\c.txt"))); // BufferedReader reader = new BufferedReader(new FileReader(new File("C:\\Users\\TKPad\\Desktop\\d.txt"))); BufferedReader reader = new BufferedReader(new FileReader(new File("C:\\Users\\TKPad\\Desktop\\e.txt"))); int ch = 0; while ((ch = reader.read()) != -1) { temp = sb.toString().trim().replaceAll("\\s*", "");// 取出前后空格,之后去除中间空格 if ((char) ch == '\r') { // 判断是否是空行 if (!"".equals(temp)) { // 说明到了段落结尾,将其加入链表,并清空sb res.add(temp); } sb.delete(0, sb.length()); } else { // 说明没到段落结尾,将结果暂存 sb.append((char) ch); } } if (reader.read() == -1) { System.out.println("哈哈,你读到了末尾嘞!"); } // 最后一段如果非空, 将最后一段加入,否则不处理 if (!"".equals(temp)) { res.add(temp); } Iterator<String> iterator = res.iterator(); while (iterator.hasNext()) { String next = iterator.next(); System.out.println("段落开始:"); System.out.println(next); } System.out.println("段落的个数是:" + res.size()); }}
*测试文本已经打包上传,敬请下载。
地址:*
http://download.csdn.net/detail/shijiebei2009/8440133
0 0
- Java实现文本按照自然段落进行切分
- Java实现文本按照自然段落进行切分
- HTML中的文本段落实现
- 使用Word对段落按照字母顺序进行排序
- Java实现-单词切分
- 按照段落来分页
- 文件分割 按照段落
- java周切分,按照指定weekday为一周的开始
- HTML文本及段落
- 按照文件修改时间遍历文件夹,进行文本连接
- iOS实现联系人按照首字母进行排序
- 快速排序-三向切分(java实现)
- C++切分超长文本
- 按照参数key或value值进行字典排序的两种java算法实现
- Java 版按照网友意见进行调正
- java按照规则进行字符串的填充
- java ArrayList按照同一属性进行分组
- Java实现按照概率产生
- 让 UISearchBar 支持空搜索
- SqlTransaction——事务详解
- 文件上传
- PDU格式说明
- macosx & ios
- Java实现文本按照自然段落进行切分
- dataguard :主库的一个归档日志没传送到备库,导致备库无法同步
- 机器学习资料整理
- Composite组合模式
- hdu 5162 Jump and Jump...
- flash上传头像插件使用说明
- 如何通过jsoup网络爬虫工具爬取网页数据,并通过jxl工具导出到excel
- Linux 挂载ISO问题-iso的命名不能出现空格
- uva514