结巴分词词性
来源:互联网 发布:手机淘宝明星店铺 编辑:程序博客网 时间:2024/05/16 01:11
jieba为自然语言语言中常用工具包,jieba具有对分词的词性进行标注的功能,词性类别如下:
Ag
形语素
形容词性语素。形容词代码为 a,语素代码g前面置以A。
a
形容词
取英语形容词 adjective的第1个字母。
ad
副形词
直接作状语的形容词。形容词代码 a和副词代码d并在一起。
an
名形词
具有名词功能的形容词。形容词代码 a和名词代码n并在一起。b
区别词
取汉字“别”的声母。c
连词
取英语连词 conjunction的第1个字母。dg
副语素
副词性语素。副词代码为 d,语素代码g前面置以D。d
副词
取 adverb的第2个字母,因其第1个字母已用于形容词。e
叹词
取英语叹词 exclamation的第1个字母。f
方位词
取汉字“方”g
语素
绝大多数语素都能作为合成词的“词根”,取汉字“根”的声母。h
前接成分
取英语 head的第1个字母。i
成语
取英语成语 idiom的第1个字母。j
简称略语
取汉字“简”的声母。k
后接成分
l
习用语
习用语尚未成为成语,有点“临时性”,取“临”的声母。m
数词
取英语 numeral的第3个字母,n,u已有他用。Ng
名语素
名词性语素。名词代码为 n,语素代码g前面置以N。n
名词
取英语名词 noun的第1个字母。nr
人名
名词代码 n和“人(ren)”的声母并在一起。ns
地名
名词代码 n和处所词代码s并在一起。nt
机构团体
“团”的声母为 t,名词代码n和t并在一起。nz
其他专名
“专”的声母的第 1个字母为z,名词代码n和z并在一起。o
拟声词
取英语拟声词 onomatopoeia的第1个字母。p
介词
取英语介词 prepositional的第1个字母。q
量词
取英语 quantity的第1个字母。r
代词
取英语代词 pronoun的第2个字母,因p已用于介词。s
处所词
取英语 space的第1个字母。tg
时语素
时间词性语素。时间词代码为 t,在语素的代码g前面置以T。t
时间词
取英语 time的第1个字母。u
助词
取英语助词 auxiliaryvg
动语素
动词性语素。动词代码为 v。在语素的代码g前面置以V。v
动词
取英语动词 verb的第一个字母。vd
副动词
直接作状语的动词。动词和副词的代码并在一起。vn
名动词
指具有名词功能的动词。动词和名词的代码并在一起。w
标点符号
x
非语素字
非语素字只是一个符号,字母 x通常用于代表未知数、符号。y
语气词
取汉字“语”的声母。z
状态词
取汉字“状”的声母的前一个字母。un
未知词
不可识别词及用户自定义词组。取英文Unkonwn首两个字母。(非北大标准,CSW分词中定义)阅读全文
0 0
- 结巴分词--词性标注
- 结巴分词词性
- jieba(结巴)分词种词性简介
- jieba(结巴)分词种词性简介
- jieba(结巴)分词种词性简介
- ictclas,ansj,结巴分词,StanfordNLP中文分词以及所用词性标注集
- 结巴分词
- 结巴分词
- python结巴分词
- 结巴分词学习笔记
- "结巴"中文分词
- 结巴分词流程图
- python 结巴分词
- 结巴分词使用方法
- Python--结巴分词
- 结巴分词功能总结
- python结巴分词
- Python---结巴分词介绍
- excel 2010 指定x轴y轴数据 画折线图
- 使用jedis操作阿里云redis
- HDU 6143 Killer Names (第二类斯特林数or容斥)
- 串
- Js下载进度条的实现
- 结巴分词词性
- python-用@property将一个方法(例如getXxx/setXxx)变成属性
- 抽象工厂模式
- 请编写一个c函数,该函数给出一个字节中被置为1的位的个数
- Python 安装模块时,使用pip install xxx安装时,很慢的解决方法
- 2017年8月14日提高组T2 温度
- C++ 顺序容器
- 单调栈
- 九度1439:Least Common Multiple