Atitit.atiInputMethod v2词库清理策略工具 q229
来源:互联网 发布:石材仿形机编程说明书 编辑:程序博客网 时间:2024/06/06 16:34
Atitit.atiInputMethod v2词库清理策略工具 q229
1.1. Foreigncode 外码清理1
1.2. 垃圾词澄清1
1.1. Foreigncode 外码清理
Only can Ascii and num
Before Be4
For 4
1.2. 垃圾词澄清
Tool long
Not common wordlib (3000-5000)
作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 ) 汉字名:艾龙, EMAIL:1466519819@qq.com
转载请注明来源: http://blog.csdn.net/attilax
1.3. Code---
package com.attilax.inputmethod;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import org.apache.commons.lang3.StringUtils;
import com.attilax.io.FileLineTraver;
import com.attilax.io.filex;
import com.attilax.lang.text.strUtil;
import com.google.common.collect.Lists;
public class WordlibClrNTrim {
public static void main(String[] args) throws IOException {
String expWordlibDir = "C:\\Users\\Administrator.ATTILAXPC188\\Documents\\[ atian inputmethod ]\\";
expWordlibDir = "C:\\Users\\Administrator\\Documents\\[ atian attilax ]\\";
String strPath = expWordlibDir + "导出 - 全部词条.txt";
if (!new File(strPath).exists())
throw new RuntimeException("file not exist");
String fileName = "c:\\wordlib" + filex.getUUidName() + ".txt";
System.out.println(fileName);
String encode = "unicode";
encode = "utf-8";
filex fc = new filex(fileName, encode);
FileLineTraver.trav(strPath, encode, (line) -> {
String[] a = line.toString().split("\t");
if (a.length < 2)
return line;
String forighCodePix = a[1];
String[] forighCode_arr = get_forighCode_arr(forighCodePix);
String forighCode = forighCode_arr[0].trim();
if (forighCode.length() == 0
|| !StringUtils.isAlphanumeric(forighCode)) // err
// foreigh
// code
{
System.out.println(line);
return "";
}
// new line
String Char = a[0];
String newLine = Char + "\t" + forighCode.trim()
+ forighCode_arr[1].trim();
fc.append_HP_Safe(newLine + "\r\n");
return line;
});
fc.closeSF();
System.out.println("--f");
}
private static String[] get_forighCode_arr(String forighCodePix) {
int SharpCharINdex = forighCodePix.indexOf("#");
String[] a = { "", "" };
a[0] = forighCodePix.substring(0, SharpCharINdex);
a[1] = forighCodePix.substring(SharpCharINdex);
return a;
}
}
- Atitit.atiInputMethod v2词库清理策略工具 q229
- Atitit.输入法配置说明v1 q229
- Atitit.atiDataStoreService v2 新特性
- Atitit.论图片类型 垃圾文件的识别与清理 流程与设计原则 与api概要设计 v2 pbj
- Atitit. 项目文档目录大纲 总集合 v2
- atitit.api设计 方法 指南 手册 v2 q929.docx
- Atitit 图像处理知识点 知识体系 知识图谱v2
- Atitit atiMail atiDns新特性 v2 q39
- Atitit. . 软件命名空间与类名命名单词的统计程序设计v2
- Atitit. Toast alert loading js控件 atiToast v2新特性
- Atitit (Sketch Filter)素描滤镜的实现 图像处理 attilax总结v2
- Atitit 图像处理之仿油画效果 Oilpaint油画滤镜 水彩画 漫画滤镜 v2
- atitit..代码生成流程图 流程图绘制解决方案 java c#.net php v2
- Atitit. 破解 拦截 绕过 网站 手机 短信 验证码 方式 v2 attilax 总结
- Atitit.java相比c#.net的优点 优缺点 v2 q330
- Atitit.文件搜索工具 attilax 总结
- 知也atitit.解决struts2 SpringObjectFactory.getClassInstance NullPointerException v2 q31无涯 - I
- Atitit.远程接口 监控与木马 常用的api 标准化v2 q216
- java序列化、反序列化;关键字transient、volatile
- ImageView设置背景图片后置灰探究
- 信用卡相关
- 安装myeclipse遇到的问题
- Redhat Linux下使用yum时碰到没有订阅服务
- Atitit.atiInputMethod v2词库清理策略工具 q229
- Tomcat 配置详解/优化方案
- Android_APP微信支付之实现代码
- 主管帶人,更要帶心!這樣做,才是贏得公司市占率的關鍵
- Unity3D学习笔记(2)——用GUI制作井字棋游戏
- yum install mysql-service 安装失败
- Atitit.输入法配置说明v1 q229
- Android 并行自动化测试系统 实现总结
- dd if 创建文件系统