Ubuntu 12.04下安装中文分词搜索Coreseek
来源:互联网 发布:销售出入库软件 编辑:程序博客网 时间:2024/06/05 07:08
Coreseek 是一款中文全文检索和搜索软件,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业和垂直搜索、论坛或站内搜索、数据库搜索、文档或文献检索、信息检索、数据挖掘等应用场景。在安装Coreseek之前,确认电脑上已经安装了如下软件包,想确认电脑上面是否安装其中某个包,可以输入命令“dpkg -l gcc”测试是否安装了gcc软件包。主要如下:
apt-get install make gcc g++ automake libtool mysql-client libmysqlclient15-dev libxml2-dev libexpat1-dev
1、安装上述软件包之后,下载“coreseek-4.1-beta.tar.gz”,输入下面命令解压:
tar -zvxf coreseek-4.1-beta.tar.gz
2、解压之后,通过命令“cd coreseek-4.1-beta/mmseg-3.2.14/”进入到mmseg-3.2.14文件夹,依次输入三条命令,如果出现错误需要去解决。
./bootstrap./configure --prefix=/usr/local/mmseg3make && make install
3、如果没有出现错误,表明mmseg安装成功了,下面继续安装csft,输入下面的命令(对于configure,可以使用“./configure -h”命令查看参数):
cd ..cd csft-4.1/sh buildconf.sh./configure --prefix=/usr/local/coreseek --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysqlmake && make install
4、输入以下命令进行测试。
测试1:
cat testpack/var/test/test.xml
测试2:分词
/usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc/ var/test/test.xml
测试3:建立索引
/usr/local/coreseek/bin/indexer -c etc/csft.conf --all
测试4:搜索
/usr/local/coreseek/bin/search -c etc/csft.conf 网络搜索
5、安装Sphinx,生成动态模块
先安装libsphinxclient,输入命令:
cd ~/Downloads/coreseek-4.1-beta/csft-4.1/api/libsphinxclient./configuremakesudo make install
安装好之后,再安装sphinx,输入下列命令:
cd ~/Downloadstar -zvxf sphinx-1.3.0.tgzcd /sphinx-1.3.0/sphinx-1.3.0sudo su/usr/bin/phpize #主要是生成configure文件./configure --with-php-config=/etc/alternatives/php-config --with-sphinxmake && make install
进入到/usr/lib/php5/20090626+lfs/ 将看到生成的sphinx.so模块,找到php.ini配置文件,将生成sphinx.so模块添加到配置文件中,输入下列命令(root权限执行):
cd /usr/lib/php5/20090626+lfs/ chmod 644 sphinx.solocate php.ini #如果不知道php.ini文件在那里,可以输入这个命令查找 geany /etc/php5/apache2/php.ini
修改的情况如下:
即添加以下内容:
extension=msqli.soextension=msql.soextension=memcache.soextension=pdo_mysql.soextension=sphinx.so
注意:添加之后重启apache服务器,输入命令:
sudo /etc/init.d/apache2 restart
在浏览器中输入“http://192.168.1.188:6789/test.php”,可以看到加载的sphinx模块都在。
6、测试coreseek(数据为数据库里面)
修改默认配置文件:
cd /usr/local/coreseek/etccp sphinx.conf.dist csft.confgeany csft.conf
配置文件的修改参考lamp兄弟连给出的。
对当前数据库里面的数据建立索引:
输入命令建立索引和搜索:
cd /usr/local/coreseek/bin./indexer --all
这个时候可以看到:
建立索引完成之后,输入命令搜索:
./search 百度
结果如下:
在PHP调用之前,先建立监听,输入命令如下:
./searchd #开启seachd服务
结果如下:
至此,整个过程已经搭建完成。
- Ubuntu 12.04下安装中文分词搜索Coreseek
- coreseek中文分词与搜索的安装
- Sphinx中文分词搜索Coreseek Windows下安装与基本使用简介
- sphinx中文分词搜索coreseek windows下安装与基本使用简介
- Sphinx中文分词搜索Coreseek Windows下安装与基本使用简介
- sphinx中文分词搜索coreseek windows下安装与基本使用简介
- coreseek中文分词搜索 简易配置
- Sphinx + Coreseek 实现中文分词搜索
- Ubuntu下安装CoreSeek
- Linux下带有中文分词的sphinx—coreseek安装和配置--2
- sphinx中文分词coreseek在linux下的安装、配置以及使用方法(入门菜鸟级)
- centos下的中文分词coreseek-4.1的编译安装与基本配置
- sphinx的安装配置和中文分词包coreseek
- sphinx的安装配置和中文分词包coreseek
- Sphinx中文分词Coreseek+Mmseg安装配置和示例
- sphinx的安装配置和中文分词包coreseek
- sphinx的安装配置和中文分词包coreseek
- coreseek sphinx+mmseg 斯分克斯 + 中文分词安装
- [Leetcode] Max Tree Sum
- windows下lib与dll关系
- HDOJ 1159 Common Subsequence 杭电 ACM
- Struts2从后台传递数据到前台的主要方法和流程
- 计算字符串之间的相似度(递归)
- Ubuntu 12.04下安装中文分词搜索Coreseek
- Go编译选项(笔记)
- sicily 1001. Alphacode
- Unbound classpath container: 'JRE System Library [jdk1.6.0_04]' in project
- vector顺序容器的添加与删除
- 洗牌和发牌游戏
- AS3优化技巧总结(不包括数据库和网络)
- CoreData多线程安全
- JSP 中使用<%@include%> 报 Duplicate local variable path 错误的解决方法