friso-1.6.1 发布 - C语言高性能中文分词器-检测模式切分
来源:互联网 发布:淘宝店主写给买家的信 编辑:程序博客网 时间:2024/05/22 10:50
Friso是使用c语言开发的一款开源中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中,例如:MySQL,PHP,源码无需修改就能在各种平台下编译使用,同时支持对UTF-8/GBK编码的切分.
friso-1.6.1:
1. friso.ini中friso.lex_dir增加相对friso.ini的路径支持,这个可以让嵌入部署更方便。
2. 修复两处内存泄漏bug。 (无名英雄找到的,在此感谢)
3. 改善中英混合词的识别, 可以识别更多情况, 例如:高3。
4. 词库优化, 加入了一些新词条。
5. 修复friso_dic_add & array_list_insert的两处代码bug。
6. 增加检测模式切分, 只返回词库中有的词条,这个对于有些需求确实挺有用的。
7. 集成了php扩展绑定,完美支持PHP分词。以前这个是单独拿出来的,并且项目为robbe,为了方便管理,现在统一绑定到了friso项目里面。
friso从下个版本开始,会逐渐去提供sphinx的token filter,socket接口等。
google code不在提供下载,下载地址:
1. git@osc 附件:http://git.oschina.net/lionsoul/friso/attach_files
2. friso SF: https://sourceforge.net/projects/friso/files/
感谢广大网友的支持和反馈,祝大家工作愉快。
0 0
- friso-1.6.1 发布 - C语言高性能中文分词器-检测模式切分
- Friso-1.6.0 发布 - C语言高性能中文分词器,GBK支持
- friso中文分词器
- friso中文分词器
- jcseg-1.9.4 发布 - Java轻量级开源中文分词器-检测模式切分
- 【文本分类】friso中文分词器介绍(c 开源)
- friso分词器的应用
- C++ NLPIR+FRISO 项目的中文分词功能添加
- lucene中文分词器--词典全切分算法
- 中文分词器性能比较
- 中文分词器性能比较
- 中文分词技术比较:单字切分 vs 中文分词
- 高性能c语言编码
- 我用纯C语言开发的中英文混合分词服务器3.0正式发布,词库190多万词,每秒切分5万+,同时提供 c、java、C#、delphi、js调用范例
- friso分词器在windows7下使用mingw编译和测试
- 中科院中文分词C语言接口调用示例
- 如何用C语言(VisualStudio)调用NLPIR进行中文分词
- 中文分词高亮问题
- CF#FF (Div. 2) A .
- android buserr
- OCMock单元测试部分知识点整理
- IP子网划分问题
- JQuery学习第二天--------选择符(一)
- friso-1.6.1 发布 - C语言高性能中文分词器-检测模式切分
- erlang中的元组与列表的区别与联系
- XAMPP 安装gearman 扩展
- vm 复选框
- U-boot分区及内核更新的实现
- 过时的PreferenceActivity导致Fragment显示问题
- java中什么时候使用finalize()方法
- Linux系统IO分析
- 如何做各种各样的澄清剂的工作什么是最好的方式来实现清晰在我的啤酒