Sphinx2.1.9使用HTML文件作为索引源技术要点备忘
来源:互联网 发布:数学分析教材 知乎 编辑:程序博客网 时间:2024/04/30 10:27
踏得网站内教程和手册的查找功能,建立在Sphinx上,其最新发布版本为2.2.11。
Sphinx既能支持数据库索引,也支持对文本文件(xml、html、txt等)和json结构文件进行直接索引。
对文本文件建立索引的主要步骤如下:
1. 使用脚本程序把所有文件的路径录入到数据库中的一张表中(至少包含2个字段,id和全路径文件名)
2. 在sphinx.conf中添加相应的索引源(source)和索引定义(index)
sql_query = SELECT id,title,file_name,url,type from your_table_name
sql_file_field = file_name
3. 用sphinx api查询设置title有较高的权重
4. 分页处理时,按sphinx api返回的id排序,参见:
http://dev.mysql.com/doc/refman/5.5/en/string-functions.html#function_field
语法示例:ORDER BY field(id, 2, 1, 4);
5. 构建文件内容摘要列表,其中$docs为所有匹配文件的内容列表,$index为索引名,$opts里面可以定义样式和限制字数等:
$sphinx->BuildExcerpts($docs, $index, $keyword, $opts);
0 0
- Sphinx2.1.9使用HTML文件作为索引源技术要点备忘
- Sphinx2.1.9安装及中文索引配置
- Sphinx2.1.9重建索引错误:Indices not rotated
- Sphinx2多个索引源及其组合查询
- HTML的技术要点
- 使用lucene生成html文件索引
- C# C/S程序使用HTML文件作为打印模板
- 使用apache作为web服务器展示一个html文件
- 使用指针数组作为索引
- 20100-10-31 ChineseName 中技术要点备忘
- RHEL5 使用 ISO 文件作为 YUM 源
- DLL生成使用关键字索引-备忘
- 欢迎使用CSDN-markdown编辑器(作为备忘)
- CentOS6下Sphinx2.1.9编译错误undefined reference to 'libiconv'
- sphinx2.0.1搜索引擎的学习研究与索引结构的修改
- html 备忘
- 技术要点
- 技术备忘
- 微信小程序 数据绑定 条件循环
- HDU 1496 Equations
- 【数学专题】 卡特兰数
- 自定义View之onDraw
- react-native开发快捷键
- Sphinx2.1.9使用HTML文件作为索引源技术要点备忘
- JS垫脚石-判断浏览器版本
- split用法的坑
- 论文笔记 《What makes for effective detection proposals?》
- jQuery插件fontIconPicker配合FontAwesome字体图标库的使用
- Android ImageView的scaleType属性与adjustViewBounds属性
- 设置渐变背景色用GradientDrawable
- yii的session跳转
- Instant Run 立即刷新功能