应用ICTCLAS的中文分词小程序
来源:互联网 发布:sql 交叉连接查询 用途 编辑:程序博客网 时间:2024/05/17 06:32
package org.liwei.dm;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.PrintStream;
import org.ictclas4j.bean.SegResult;
import org.ictclas4j.segment.SegTag;
public class Divid {
public static void main(String[] args) throws Exception{
File file = new File ("c:" + File.separator + "dm" + File.separator + "dividsource");
String path[] = file.list();
System.out.println(path.length);
PrintStream out = System.out;
for (int i = 0; i<path.length; i++){
System.out.println(path[i]);
BufferedReader buf = null;
File f = new File ("c:" + File.separator + "dm" + File.separator + "dividsource"+ File.separator + path[i]);
System.setIn(new FileInputStream(f));
InputStream input = System.in;
buf = new BufferedReader(new InputStreamReader(input));
char b[]=new char[100000];
int a=0,len=0;
while((a=buf.read(b,0,100000))!=-1){
len = a;
}
SegTag st = new SegTag(1);
SegResult sr = st.split(new String(b,0,len));
File s = new File ("c:" + File.separator + "dm" + File.separator + "dividresult"+ File.separator + i+".txt");
PrintStream ps=new PrintStream(new FileOutputStream(s));
System.setOut(ps);
System.out.println(sr.getFinalResult());
System.setOut(out);
buf.close();
buf=null;
}
}
}
- 应用ICTCLAS的中文分词小程序
- 【中文分词】基于ICTCLAS的Python中文分词
- 让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
- 让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
- 基于hadoop的分词程序(ICTCLAS分词器)
- CLucene加入ICTCLAS中文分词
- Lucene下引入ICTCLAS进行中文分词的实现方法
- Java通过JNI调用ICTCLAS中文分词包的方法
- 智能中文分词小程序
- 什么是中文分词-中文分词的应用
- 中科院ICTCLAS中文分词工具C++源码
- 【文本分类】最强中文分词系统ICTCLAS
- Python调用PYNIPIR(ICTCLAS)进行中文分词
- hadoop学习【8】——基于hadoop的分词程序二(ICTCLAS分词器)
- 全文检索4(关于中文分词ICTCLAS分词系统)
- ICTCLAS 中科院分词系统 代码 注释 中文分词 词性标注
- ICTCLAS 中科院分词系统 代码 注释 中文分词 词性标注
- 简单的中文分词程序
- The Chromium Projects -- libyuv
- SQL 优化原则
- 黑马程序员_java正则表达式学习
- 【经验】在CSS中定义a:link、a:visited、a:hover、a:active顺序
- DB2 用法整理
- 应用ICTCLAS的中文分词小程序
- wince2秒快速启动TOC分析
- 警惕C++令人恼怒的解析
- 黑马程序员_java网络编程学习
- 模板——Straight Insertion Sort
- Android battery supply
- RS232、RS485及RS422有什么区别?
- datalab 深入理解计算机系统实验
- 动态页面生成静态页面的原理