fudanNLP(fnlp)添加自定义字典
来源:互联网 发布:崛起平台网络兼职 编辑:程序博客网 时间:2024/04/28 14:10
fnlp
目前找到的接口方便的开源的NLP开源工具
StanfordNLP
Hanlp
FudanNLP
NLTK
LTP
由于StanfordNLP中文包配置较困难,使用fnlp做分词加语义
考虑语义依存时,算法几乎都如出一辙的HMM,所以暂且认为模型参数问题可以用scale的数据量弥补。
fnlp
这是一段具有分词,实体识别,语义依存功能的代码
import org.fnlp.nlp.cn.tag.POSTagger;import org.fnlp.nlp.parser.dep.DependencyTree;import org.fnlp.nlp.parser.dep.JointParser;import org.fnlp.ml.types.Dictionary;import org.fnlp.nlp.cn.tag.CWSTagger;import org.fnlp.nlp.cn.tag.NERTagger;import java.util.HashMap;//需要实现实体识别//实现语义依存public class function_test { private static JointParser parser; /** * @param args * @throws Exception */ public static void main(String[] args) throws Exception { parser = new JointParser("models/dep.m"); String word = "中国进出口银行与中国银行深度加强合作张持良。这是一个可扩展的机器集群华兴资本"; test_dep(word);// test_ner(word); } /** * 测试语义依存 * 只输入句子,不带词性 * @throws Exception */ private static void test_dep(String word) throws Exception { POSTagger tag = new POSTagger("models/seg.m","models/pos.m",new Dictionary("models/dict.txt")); String[][] s = tag.tag2Array(word); try { DependencyTree tree = parser.parse2T(s[0],s[1]); System.out.println(tree.toString()); String stree = parser.parse2String(s[0],s[1],true); System.out.println(stree); } catch (Exception e) { e.printStackTrace(); } }}
output:
中国 进出口 银行 与 中国 银行 深度 加强 合作 张持良 。 这 是 一 个 可 扩展 的 机器 集群 华兴资本地名 名词 名词 并列连词 地名 名词 名词 动词 名词 人名 标点 指示词 动词 数词 量词 动词 动词 结构助词 名词 名词 公司名2 2 6 2 5 6 7 12 9 7 12 12 -1 14 17 17 15 12 19 12 12定语 定语 并列 关联 定语 定语 主语 状语 定语 宾语 标点 主语 核心词 数量 的字结构 的字结构 补语 补语 定语 补语 补语
很明显,在加了词典后,‘华兴资本’这个公司名被识别出来了
0 0
- fudanNLP(fnlp)添加自定义字典
- 自然语言处理Java开源包FNLP(FudanNLP)的使用
- fnlp
- fudanNLP-使用
- fudanNLP-使用
- 笔记-FudanNLP
- fudannlp初试
- FNLP编译安装
- Mac 字典添加字典库
- python 字典 添加元素
- 自定义字典键对象
- 自定义model 转出 字典
- dl4j+fnlp关联度TopN
- Leopard内置字典添加中英字典
- 自定义模型转字典,字典转模型
- python_给字典添加条目
- python 给字典 添加元素
- 开源中文分词FudanNLP
- GPU arch
- OpenCV之imgproc 模块. 图像处理(2)实现自己的线性滤波器 给图像添加边界 Sobel 导数 Laplace 算子 Canny 边缘检测
- 投影坐标系 X和Y坐标的位数
- JNI error:libEGL: call to OpenGL ES API with no current context (logged once per
- HDOJ 2027 统计元音
- fudanNLP(fnlp)添加自定义字典
- java中的日期
- OpenCV之imgproc 模块. 图像处理(3)霍夫线变换 霍夫圆变换 Remapping 重映射 仿射变换
- LeetCode 315. Count of Smaller Numbers After Self (逆序数对)
- 实参与形参的传递关系
- shell脚本中一些特殊符号
- 235. Lowest Common Ancestor of a Binary Search Tree
- Nginx设置虚拟主机,添加多站点
- QT - OpenCV的安装与配置(转载)