我的中文句法分析器
来源:互联网 发布:手机淘宝买家秀在哪里 编辑:程序博客网 时间:2024/05/18 03:19
我的中文句法分析器
鉴于上次“如此开源”之痛,所以花了几天时间,边看《诛仙》边完成了一个通用的中文句法分析器,采用Earley的Chart Parsing算法,当然也基于我强大的中文分词标注一体化系统。偶然想到在这个一体化系统上再融合进句法分析,实在是一个不错的升华想法,不过还没有弄到Penn Chinese Treebank的训练语料,所以还没法做概率句法分析,等有机会吧。还要抽时间把我的sourceforge目录整理一下才行,或许可以在适当的时候把整个句法分析的源码传上去,不过要写好详细的文档又不在计划中,所以也不知道又要拖到啥时候,这似乎有点像萧大写《诛仙》的速度了,呵。
有人问到我的sourceforge目录地址,我这里只有暂时说抱歉,以前的确打算在sourceforge上建立一个中文句法分析的project,但是
因为我的中文句法分析器其实始终是以模块形式置于别的系统中使用的,主要是用来训练和抽取所需的数据,以达到一定程度上句法信息的引入,并没有做成一套单纯的句法分析系统,毕竟工作的我还是以应用为需求来设计和开发东西。如果将来我重返学校的话就可以把我所实现的所有语言处理模型都open source,毕竟这是我一直以来的追求。
对于句法分析而言,Chart Parsing算法很有效,但只是一个小东西,如果把输入进行简化,直接输入人工标注和分好词的数据,把句法规则定义得简单一点,那么实现一个简单的句法分析也就几百行代码的事情。如果有同学也在试图书写这样的代码的话,我还是希望其可以自己动一下手,从简单的开始,逐步积累经验,毕竟自然语言处理技术还是大有可为的。
0 0
- 我的中文句法分析器
- 我的中文句法分析器
- Stanford Parser中文句法分析器的使用
- 中文句法分析器 下载
- 一个基于括号匹配原理的汉语句法分析器
- 我的编译器 分析器
- 我的词法分析器
- 我的词法分析器源代码
- 15、Analyzer分析器之中文分析器的扩展
- 中文句法分析
- stanford parser中文句法分析时注意的问题
- Lucen支持中文分词的分析器使用
- solr之Ik中文分析器的安装
- 我的程序(3):词法分析器
- Lucene中文分析器的中文分词准确性和性能比较
- Lucene中文分析器的中文分词准确性和性能比较
- Lucene中文分析器的中文分词准确性和性能比较
- stanford parser 中文句法分析
- 文章代码背景
- ExtJs4学习(一):正确认识ExtJs4
- Hadoop集群间数据拷贝
- iframe 自适应内容高度
- word2vec 中的数学原理详解(三)背景知识
- 我的中文句法分析器
- fedora 20 install skype
- ios中@class和 #import区别
- [Qt学习篇]UDP编程
- VBA快速转换数据格式,将CBOT结算价历史数据导入数据库(图文)
- 【c++】string类的实现
- anroid 使用 Gson 混淆 遇到的bug 总结
- 《分布式操作系统》知识点(22~28)四
- ZK ACL访问的一个小demo