linux sphinx 中文分词
来源:互联网 发布:网络维护不会可以做吗 编辑:程序博客网 时间:2024/05/18 00:04
1.上传coreseek-3.2.14.tar.gz到用户目录下
tar -zxvf coreseek-3.2.14.tar.gz 解压该压缩文件包
2.安装mmseg(中文分词)
cd coreseek-3.2.14/
cd mmseg-3.2.14/
./configure --prefix=/usr/local/mmseg3
make && make install
3.安装coreseek
./configure --prefix=/usr/local/coreseek --without-unixodbc --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql-includes=/usr/local/server/mysql/include/ --with-mysql-libs=/usr/local/server/mysql/lib/
make & make install
cd /usr/local/coreseek/etc
cp sphinx.conf.dist csft.conf 将配置文件改名为csft.conf
vi csft.conf 打开配置文件 更改配置
source xxxx 主源的名称
{
sql_host =localhost
sql_host =root
sql_host =123
sql_host =xxxx
sql_port =3306
sql_sock =/tmp/mysql.sock
sql_query_pre =SET NAMES utf8
sql_query_pre =SET SESSION query_cache_type=OFF
sql_query_pre =select id,title,flag,post,auth,ip,edtime,hits from table表
sql_query_info =SELECT * FROM table WHERE id=$id
}
#source src1throttled:src1 增量源 全部注释
#{
#
#}
index xxxx 主源索引
{
source =xxxx
path =/usr/local/coreseek/var/data/xxx
docinfo = extern
#stopwords 停词 注释掉
#wordforms 文字格式 注释掉
charset_type=zh_cn.utf-8
charset_dictpath=/usr/local/mmseg/etc/
}
#index test1stemmed:test1 增量索引全部注释掉
#{
#
#}
#index dist1分布式索引 全部注释掉
#{
#
#}
indexer 索引生成器 默认就行
{
mem_limit =32M 默认使用内存大小 如果需要可以改大
}
searchd 搜索进程 使用默认
{
}
常用命令:
/usr/local/coreseek/bin/searchd 运行守护进程
/usr/local/coreseek/bin/searchd --stop 停止服务进程
/usr/local/coreseek/bin/indexer --all //创建所有索引
/usr/local/coreseek/bin/indexer index_name // 创建指定索引
/usr/local/coreseek/bin/search ’关键字搜索‘ //测试搜索
- linux sphinx 中文分词
- linux 下sphinx的中文分词包mmseg安装
- sphinx+mysql+中文分词安装
- sphinx mmseg mysql 中文分词
- coreseek 中文分词 and sphinx
- sphinx分布式配置+中文分词
- linux下搭建sphinx+scws+mysql中文分词搜索,及sphinx配置文件详解
- sphinx中文分词mmseg的一个bug
- sphinx应用,中文分词核心配置!
- Mysql+sphinx+mmseg中文分词(ubuntu)
- Sphinx + MySQL + 中文分词安装配置
- Mysql+sphinx+中文分词简介(ubuntu)
- sphinx与中文分词coreseek(window)
- Sphinx + Coreseek 实现中文分词搜索
- 在Linux下安装Sphinx+MySQL5.1x+SphinxSE+mmseg中文分词
- Linux下带有中文分词的sphinx—coreseek安装和配置--2
- sphinx中文分词coreseek在linux下的安装、配置以及使用方法(入门菜鸟级)
- sphinx中文分词检索 如何让分词的精确度更高
- ANDROID开发中定时器的3种方法
- Struts2.1.6+Spring2.5.6+Hibernate3.3.1全注解实例详解(四)
- FCKeditor的配置和使用方法
- Struts2.1.6+Spring2.5.6+Hibernate3.3.1全注解实例详解(五)
- 共轭梯度法(conjugate gradient method)
- linux sphinx 中文分词
- 基于SSH2框架Struts2拦截器的登录验证实现
- java泛型相关经验总结
- 基于SSH2框架AspectJ的登录登出日志实现
- Fedora18设置终端快捷键 和 桌面快捷方式
- jQuery验证控件jquery.validate.js使用说明+中文API
- Annotations in JUnit
- 寻找最大的K个数
- TS数据结构分析