《Python自然语言处理》学习笔记-第五章

来源:互联网 发布:电影社交网络中的博客 编辑:程序博客网 时间:2024/05/18 12:34

第五章:分类和标注词汇


引入
①本章将介绍NLP中的一些基本技术,包括序列标注,N-gram模型、回退和评估。
②词性标注(简称标注):是将词汇按照它们的词性进行分类和标注的过程。
③词性也称为词类或者词汇范畴。
④用于特定任务的标记集合简称标记集。


5.1 使用词性标注器

①一个词性标注器处理一个词序列,为每个词附加一个词性标记。
②使用nltk的pos_tag方法,返回词和相应词性的元组构成的列表。

阅读全文
0 0
原创粉丝点击