基于HMM中文词性标记(一)——汉语词性对照表[北大标准/中科院标准]
来源:互联网 发布:php将数组转化成json 编辑:程序博客网 时间:2024/04/29 06:39
汉语词性对照表[北大标准/中科院标准]
词性编码
词性名称
注解
Ag
形语素
形容词性语素。形容词代码为 a,语素代码g前面置以A。
a
形容词
取英语形容词 adjective的第1个字母。
ad
副形词
直接作状语的形容词。形容词代码 a和副词代码d并在一起。
an
名形词
具有名词功能的形容词。形容词代码 a和名词代码n并在一起。
b
区别词
取汉字“别”的声母。
c
连词
取英语连词 conjunction的第1个字母。
dg
副语素
副词性语素。副词代码为 d,语素代码g前面置以D。
d
副词
取 adverb的第2个字母,因其第1个字母已用于形容词。
e
叹词
取英语叹词 exclamation的第1个字母。
f
方位词
取汉字“方”
g
语素
绝大多数语素都能作为合成词的“词根”,取汉字“根”的声母。
h
前接成分
取英语 head的第1个字母。
i
成语
取英语成语 idiom的第1个字母。
j
简称略语
取汉字“简”的声母。
k
后接成分
l
习用语
习用语尚未成为成语,有点“临时性”,取“临”的声母。
m
数词
取英语 numeral的第3个字母,n,u已有他用。
Ng
名语素
名词性语素。名词代码为 n,语素代码g前面置以N。
n
名词
取英语名词 noun的第1个字母。
nr
人名
名词代码 n和“人(ren)”的声母并在一起。
ns
地名
名词代码 n和处所词代码s并在一起。
nt
机构团体
“团”的声母为 t,名词代码n和t并在一起。
nz
其他专名
“专”的声母的第 1个字母为z,名词代码n和z并在一起。
o
拟声词
取英语拟声词 onomatopoeia的第1个字母。
p
介词
取英语介词 prepositional的第1个字母。
q
量词
取英语 quantity的第1个字母。
r
代词
取英语代词 pronoun的第2个字母,因p已用于介词。
s
处所词
取英语 space的第1个字母。
tg
时语素
时间词性语素。时间词代码为 t,在语素的代码g前面置以T。
t
时间词
取英语 time的第1个字母。
u
助词
取英语助词 auxiliary
vg
动语素
动词性语素。动词代码为 v。在语素的代码g前面置以V。
v
动词
取英语动词 verb的第一个字母。
vd
副动词
直接作状语的动词。动词和副词的代码并在一起。
vn
名动词
指具有名词功能的动词。动词和名词的代码并在一起。
w
标点符号
x
非语素字
非语素字只是一个符号,字母 x通常用于代表未知数、符号。
y
语气词
取汉字“语”的声母。
z
状态词
取汉字“状”的声母的前一个字母。
- 基于HMM中文词性标记(一)——汉语词性对照表[北大标准/中科院标准]
- 汉语词性对照表[北大标准/中科院标准]
- 汉语词性对照表[北大标准/中科院标准]
- 中科院ICTCLAS分词汉语词性标记集
- 分词:词性标注北大标准
- 分词:词性标注北大标准
- 分词:词性标注北大标准
- 分词:词性标注北大标准
- 基于一阶HMM的中文词性标注(Java实现)
- 中文分词词性对照表
- 中文分词词性对照表
- 中文分词词性对照表
- 中文分词词性对照表
- 中文分词词性对照表
- 中文分词词性对照表
- 中科院词性标注标记集
- 计算所汉语词性标记集
- 计算所汉语词性标记集
- 数据库开发之【ADO.NET级别事务】
- 【live555】Medium的子类们的静态方法lookupByName的实现
- 大整数加法
- 留着当模版用(servlet和ajax)
- ActionContext和ServletActionContext小结
- 基于HMM中文词性标记(一)——汉语词性对照表[北大标准/中科院标准]
- Android实现数据存储技术
- 转战微博—从Twitter上市谈起
- 新网站如何快速被百度收录
- JDK环境变量配置方法(初学者可以看懂)
- 修改学生信息窗体——基本数据该从哪里读入
- poj3294(不小于k个字符串中的最长子串---后缀数组)
- ORACLE 多表关联查询SQL 语法结构梳理
- 进程间通信(2) - 信号(signal)