Ubuntu 12.04下安装中文分词搜索Coreseek

来源:互联网 发布:销售出入库软件 编辑:程序博客网 时间:2024/06/05 07:08

        Coreseek 是一款中文全文检索和搜索软件,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业和垂直搜索、论坛站内搜索、数据库搜索、文档文献检索、信息检索、数据挖掘等应用场景。在安装Coreseek之前,确认电脑上已经安装了如下软件包,想确认电脑上面是否安装其中某个包,可以输入命令“dpkg -l gcc”测试是否安装了gcc软件包。主要如下:

apt-get install make gcc g++ automake libtool mysql-client libmysqlclient15-dev libxml2-dev libexpat1-dev

1、安装上述软件包之后,下载“coreseek-4.1-beta.tar.gz”,输入下面命令解压:

tar -zvxf coreseek-4.1-beta.tar.gz

2、解压之后,通过命令“cd coreseek-4.1-beta/mmseg-3.2.14/”进入到mmseg-3.2.14文件夹,依次输入三条命令,如果出现错误需要去解决。

./bootstrap./configure --prefix=/usr/local/mmseg3make && make install

3、如果没有出现错误,表明mmseg安装成功了,下面继续安装csft,输入下面的命令(对于configure,可以使用“./configure -h”命令查看参数):

cd ..cd csft-4.1/sh buildconf.sh./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysqlmake && make install

4、输入以下命令进行测试。
测试1:

cat testpack/var/test/test.xml


测试2:分词

/usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc/ var/test/test.xml


测试3:建立索引

/usr/local/coreseek/bin/indexer -c etc/csft.conf --all


测试4:搜索

/usr/local/coreseek/bin/search -c etc/csft.conf 网络搜索


5、安装Sphinx,生成动态模块
先安装libsphinxclient,输入命令:

cd ~/Downloads/coreseek-4.1-beta/csft-4.1/api/libsphinxclient./configuremakesudo make install

安装好之后,再安装sphinx,输入下列命令:

cd ~/Downloadstar -zvxf sphinx-1.3.0.tgzcd /sphinx-1.3.0/sphinx-1.3.0sudo su/usr/bin/phpize              #主要是生成configure文件./configure --with-php-config=/etc/alternatives/php-config --with-sphinxmake && make install

进入到/usr/lib/php5/20090626+lfs/ 将看到生成的sphinx.so模块,找到php.ini配置文件,将生成sphinx.so模块添加到配置文件中,输入下列命令(root权限执行):

cd /usr/lib/php5/20090626+lfs/  chmod 644 sphinx.solocate php.ini        #如果不知道php.ini文件在那里,可以输入这个命令查找 geany /etc/php5/apache2/php.ini

修改的情况如下:


即添加以下内容:

extension=msqli.soextension=msql.soextension=memcache.soextension=pdo_mysql.soextension=sphinx.so

注意:添加之后重启apache服务器,输入命令:

sudo /etc/init.d/apache2 restart

在浏览器中输入“http://192.168.1.188:6789/test.php”,可以看到加载的sphinx模块都在。


6、测试coreseek(数据为数据库里面)
修改默认配置文件:

cd /usr/local/coreseek/etccp sphinx.conf.dist csft.confgeany csft.conf

配置文件的修改参考lamp兄弟连给出的。
对当前数据库里面的数据建立索引:


输入命令建立索引和搜索:

cd /usr/local/coreseek/bin./indexer --all

这个时候可以看到:


建立索引完成之后,输入命令搜索:

./search 百度

结果如下:


在PHP调用之前,先建立监听,输入命令如下:

./searchd     #开启seachd服务

结果如下:


至此,整个过程已经搭建完成。


原创粉丝点击