使用CRF++进行命名实体识别

来源:互联网 发布:网络阅读媒介有哪些 编辑:程序博客网 时间:2024/05/20 16:42

首先明白什么是命名实体识别,就是通过自然语言处理获取到一段话中的实体(人名,地名,机构名,也可以是医学症状)。
命名实体识别的算法有HMM,MEMM,CRF。比较三个算法的优缺点,本文使用CRF工具CRF++来进行实验做命名实体识别。
CRF++在windows下面不需要安装,只需要下载二进制文件,下载地址

https://drive.google.com/drive/folders/0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0

然后看CRF++官方文档

https://taku910.github.io/crfpp/

并且达观数据给出了训练的例子

http://zhuanlan.51cto.com/art/201705/540693.htm

这样我们就可以订制自己的命名实体识别系统。

原创粉丝点击