1 自然语言处理中文语料与词汇资源从哪里获取

来源:互联网 发布:linux 禁止ip连接 编辑:程序博客网 时间:2024/06/14 07:09

按照网上大神的自己动手做聊天机器人教材来一步步学习,在边学的时候,一边总结,一边思考提问,对后续自己做机器学习人应该会有帮助。
自己动手做聊天机器人 三-语料与词汇资源这里面介绍的英文的语料库,我们中国的语料库就得自己找找了
国家语委现代汉语语料库,这资料里面现代汉语的常见字,以及字使用的频率。下图是下载后的一个表格,将词语的词类和词类英文标记标注清楚了。标准是按照信息处理用现代汉语词类标记规范
1
下面这个资料比较全,国内可外用免费语料库下载资源汇总
资源有些可以下载,有些不能,我没有统计,接下来需要思考,这些资源在自然语言处理中怎么用呢?

阅读全文
0 0