Node.JS 中文分词模块
来源:互联网 发布:马格努森 知乎 编辑:程序博客网 时间:2024/05/22 09:26
mmseg-node
一个基于 libmmseg 的 NodeJS 驱动。
使用方法
var mmseg = require("mmseg");var q = mmseg.open('/usr/local/etc/');console.log(q.segmentSync("我是中文分词"));
Github 地址
https://github.com/zzdhidden/mmseg-node
nseg
基于 MMSG 中文分词算法。
示例
var dict = require('../data/dict'), freq = require('../data/freq'), date = require('../lex/datetime'), sina = require('../lex/sina');var opts = { dict: dict, freq: freq, lexers: [date, sina], };var nseg = require('nseg').evented(opts);var strmOut = fs.createWriteStream(target, {flags: 'w+', encoding: 'utf-8'}), strmIn = fs.createReadStream(input);var pipe = nseg(strmIn, strmOut);pipe.on('error', function (err) { console.log('error', err);});pipe.start();
var dict = require('../data/dict'), freq = require('../data/freq'), date = require('../lex/datetime'), sina = require('../lex/sina');var opts = { dict: dict, freq: freq, lexers: [date, sina], };var nseg = require('nseg').normal(opts);nseg('研究生源计划', function (result) { console.log(result);});
Github 地址
https://github.com/mountain/nseg
node-segment
node-segment 模块以盘古分词组件
中的词库为基础,算法设计也部分参考了盘古分词组件中的算法。
使用方法
// 载入模块var Segment = require('node-segment').Segment;// 创建实例var segment = new Segment();// 使用默认的识别模块及字典segment.useDefault();// 开始分词console.log(segment.doSegment('这是一个基于Node.js的中文分词模块。'));
Github 地址
https://github.com/leizongmin/node-segment
- Node.JS 中文分词模块
- 分词:几个免费的中文分词模块
- Python分词模块推荐:结巴中文分词
- Python分词模块推荐:结巴中文分词
- 分词---几个免费的中文分词模块
- Python分词模块推荐:jieba中文分词
- Python分词模块推荐:jieba中文分词
- 免费的中文分词模块
- node.js os模块
- node.js Buffer模块
- node.js os模块
- node.js常用模块
- Node.js 模块 包
- Node.js 模块 包
- Node.js模块定义
- Node.js模块系统
- Node.js系列--模块
- node.js常用模块
- 苹果公司面试11问
- Gravatar通用头像
- mongodb如何全文检索
- 使用Coreseek建立全文搜索索引
- wordpress文章页添加作者信息
- Node.JS 中文分词模块
- Java获取系统时间的几种方法
- Java Eclipse 如何导入外部Jar包
- java中产生随机数(字符)
- 苹果为什么把OS X弄得越来越像iOS?
- 用jquery操作xml文件
- sphinx结合mongodb、xml做全文搜索
- Ubuntu Server12.04 下安装配置 JDK
- add-apt-repository: command not found