ThinkPHP之中文分词查询

来源:互联网 发布:e盾网络验证破解4.0 编辑:程序博客网 时间:2024/06/04 19:50

这里用到的分词是 第四版的 PSCWS,虽速度然比较慢,但是简单啊,不多废话,下面开始步骤。

首先在官网上下载对应版本
thinkphp之中文分词查询
thinkphp之中文分词查询
这里需要下载XDB词典和pscws4的sdk,解压这两个文件,将dict.utf8.xdb词典和sdk文件夹下的rules.utf8.ini放在PUblic下的dict文件夹里
thinkphp之中文分词查询
thinkphp之中文分词查询

thinkphp之中文分词查询
thinkphp之中文分词查询

将sdk下的这两个文件移动到Vendor下的Pscws里
thinkphp之中文分词查询
thinkphp之中文分词查询
并修改名称为PSCWS4.php和xdb_r.php,在PSCWS4.php的120行左右把构造函数修改为如下形式
thinkphp之中文分词查询
thinkphp之中文分词查询
三、添加分词私有方法
thinkphp之中文分词查询
thinkphp之中文分词查询
四、在需要分词的地方调用该方法就能够进行分词,如下
$key_array = $this->get_tags($content);
接下来就是逻辑实现了,
thinkphp之中文分词查询
thinkphp之中文分词查询

原创文章,转载请注明出处。