搜索技术概述

来源:互联网 发布:sqlserver数据恢复 编辑:程序博客网 时间:2024/04/18 10:28

搜索技术概述

       搜索引擎是一个广义的概念,包括广义上的大搜索,如google,baidu,sogou等等,也包括一些垂直或领域的搜索,如电商搜索,企业知识库搜索等等。它们的区别很大程序上是数据源的不同,进而导致的数据量上的不同,当然设计的复杂程都相差很大。

       从企业应用的角度来讲,无非是直接使用开源的框架如基于lucence的solr框架,该框架支持分布式搜索,使用相当灵活,再就是自主研发,开源的搜索框架没有正式使用过,后述的文章主要讨论一下自主研发的垂直搜索相关的技术。

      谈搜索首先想到的就是数据源,垂直搜索的数据源都是企业内部的数据库,所以需要一个一个数据读取端,负责从数据库里面把基本的数据读取出来。数据读取出来是为搜索服务的,如何才能提供快速的查找服务呢,建索引,对是需要建索引,但是这个索引是倒排索引,那么就需要一个倒排索引生成端,当然数据有了,为了对外服务,还需要一个服务端,负责加载各种数据,对外提供搜索服务。

 

0 0
原创粉丝点击