搜索架构引擎、方案与细节
来源:互联网 发布:java语言艺术与科学 编辑:程序博客网 时间:2024/05/21 21:35
参考
搜索架构
(1)全网搜索引擎系统由spider,search&index,rank三个子系统构成
(2)站内搜索引擎与全网搜索引擎的差异在于,少了一个spider子系统
(3)spider和search&index系统是两个工程系统,rank系统的优化却需要长时间的调优和积累
(4)正排索引(forwardindex)是由网页url_id快速找到分词后网页内容list<item>的过程
(5)倒排索引(invertedindex)是由分词item快速寻找包含这个分词的网页list<url_id>的过程
(6)用户检索的过程,是先分词,再找到每个item对应的list<url_id>,最后进行集合求交集的过程
(7)有序集合求交集的方法有
自研搜索的话,历史数据怎么迁移到新的架构上。产生数据的业务服务是否要重构?工程上要考虑哪些方面和流程?
(1)数据初始化,需要重建索引
(2)为了保证数据一致性,索引紧密性,也需要定期重建索引
(3)搜索的接口、架构变化了,调用需要升级
0 0
- 深入浅出搜索架构引擎、方案与细节
- 搜索架构引擎、方案与细节
- 深入浅出搜索架构引擎、方案与细节(上)
- 深入浅出搜索架构引擎、方案与细节(上)
- 深入浅出搜索架构引擎、方案与细节(上)
- 深入浅出搜索架构引擎、方案与细节(上)
- 搜索系统—搜索引擎的原理,架构与细节
- 电子商务网站搜索架构方案
- Heartbeat+DRBD+MySQL高可用架构方案与实施过程细节 【转】
- Heartbeat+DRBD+MySQL高可用架构方案与实施过程细节
- Web服务搜索与执行引擎(四)——基于(三)的系统架构设计
- Web服务搜索与执行引擎(四)——基于(三)的系统架构设计
- Web服务搜索与执行引擎(四)——基于(三)的系统架构设计
- Web服务搜索与执行引擎——系统设计方案 及系统架构设计
- Web服务搜索与执行引擎(四)——基于(三)的系统架构设计
- 搜索精准度优化架构方案
- MySQL架构与innodb引擎
- MySQL--> 架构与概念-->MySQL架构方案
- spring依赖注解
- RPC
- 【自考】——计算机网络原理
- lvs为什么不能完全替代DNS轮询
- Python之读取TXT文件的三种方法
- 搜索架构引擎、方案与细节
- 推荐系统
- Javascript 常用数组操作方法总结
- 数据库中一对多情况疑问记录
- 算法
- GitLab的简单使用
- android软键盘的关闭监听
- 如何实施异构服务器的负载均衡及过…
- java基础4