元搜索

来源:互联网 发布:淘宝联盟 京东 编辑:程序博客网 时间:2024/04/27 14:13

Meta-search engine(元搜索引擎)是在前述搜索引擎基础上建立的可以同时查询多个搜索引擎的WWW站点,其英文原意是搜索引擎之后或之上的搜索引擎,因而也可以叫做后搜索引擎。虽然元搜索引擎依赖其他独立搜索引擎而存在,但它们集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能,查一个元搜索引擎就相当于查多个独立搜索引擎,可以收到事半功倍的效果,故值得选用。

按照搜索机制划分,元搜索引擎包括并行式和串行式两类,并行式元搜索引擎运行时是将查询请求同时发向各个独立搜索引擎,然后将的结果按特定的顺序呈现给用户;串行式元搜索引擎运行时是将查询请求先发向某个独立搜索引擎,待其返回结果后再将请求发往另一个独立搜索引擎。显然,并行式元搜索引擎运行模式较好,搜索所需时间也较短。

现将主要的元搜索引擎介绍如下。

1) Cyber411是并行式元搜索引擎,它可以同AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6个独立万维网搜索引擎和9个其他Internet功能搜索引擎,但它没有任何高级搜索选项或者定制选项,只适于作为元搜索的入门,让初学者查找简单而明确的目标。

Cyber411的搜索功能包括:(1)支持简单搜索;(2)不支持高级搜索;(3)不支持目录搜索。可以选择搜索引擎。由于Cyber411不能为其所查询的15个搜索引擎中的每个引擎都转化搜索语法,所以对于高级查询或复杂搜索来说,Cyber411返回的结果很多与所查问题不相关。这是Cyber411的缺陷。

2) DigiSearch是目前能同时调用独立搜索引擎较多的并行式元搜索引擎,它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo、OpenText和Magellen等18个独立万维网搜索引擎、DejaNews等3个Usenet搜索引擎和Four11等3个个人信息和商界信息搜索引擎。

DigiSearch的搜索功能包括:(1)支持简单搜索;(2) 支持高级搜索;(3)不支持目录搜索。搜索类型可选Web(万维网页)、Usenet(新闻论坛)、 People & Business(个人信息和商界信息)。

其特色和优势是:

① 允许使用*作为通配符,支持+、-词操作。

② 允许设置最大搜索时间(分钟),放弃超过该时间后返回的信息。

③ 由用户自行选择调用哪些搜索引擎,查询结果按来源引擎依次排出。

缺点是从每个独立引擎查得的结果都被不加处理地列出,甚至包括每个独立引擎的部分界面,这样就使查询结果的显示速度很慢。由于调用的独立搜索引擎较多,DigiSearch只要改进对返回结果的处理方式,就将会成为一个较好的元搜索引擎。

3) Dogpile是目前性能较好的并行式元搜索引擎之一,它可以同时调用25个Web Search Engine、Usenet Search Engine、FTP Search Engine等,其中Web Search Engine 14个。 

Dogpile的搜索功能包括:(1)支持简单搜索;(2) 支持高级搜索;(3)不支持目录搜索。搜索类型缺省为The Web(万维网页),也可查Usenet(新闻论坛)、FTP(文件资源)等。

其特色和优势是:

① 采用独特的并行和串行相结合的查询方式:首先并行地调用3个搜索引擎;如果没有得到10个以上的结果,则并行地调用另外3个搜索引擎,如此重复直到获得至少10条结果为止。

② 可使用布尔算符和模糊查询。Dogpile的搜索技术十分先进,即使是高级运算符和连接符,它也能将其转化为符合每个搜索引擎的语法。可以使用*作为通配符,支持+、-词操作。

③ 可设置最大查询时间。但与DigiSearch 不同,Dogpile的查询时间是按秒计算的。  

缺点是不允许选择使用哪些独立搜索引擎。 查询的质量良好和搜索类型全面已使Dogpile成为较著名的元搜索网点。

4) Highway61是并行式元搜索引擎,可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo 6个独立引擎,并将它们传回的结果进行排序,显示给用户。

Highway61的搜索功能包括:

(1)支持简单搜索; (2)支持高级搜索;(3)不支持目录搜索。搜索类型限定为Web (万维网页)。  

其特色是:

① 提供AND和OR两种逻辑组合选择。  

② 用户每次查询的参数会存在“cookie”中,下次查询时会自动设置好。

③ 对查出结果进行组织,按页面评分排序,并在查询结果中指出信息源。

缺点是查全性能和查准性能都不理想。

5)Mamma是并行式元搜索引擎,自称是所有搜索引擎之母(Mother of all Search Engines),它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo等独立引擎,并且可以查新闻组、商业黄页和发布新闻。Mamma的搜索功能包括:(1)支持简单搜索;(2) 支持高级搜索;(3)不支持目录搜索。搜索类型缺省为Web(万维网页),也可选查Usenet(新闻论坛)、Picture(图画)、Sound(声音)等。

其特色和优势是:

①具有独特的查Picture和Sound功能。

②会自动对查询结果进行整理,使结果看上去就像是从一个数据库中查出来的。

③会自动将搜索策略转化为符合各搜索引擎的语法,使之能返回正确的结果。  

缺点是搜索结果无可信度排名,也不列出源引擎。

6) MetaCrawler是独立万维网搜索引擎WebCrawler的姐妹引擎,也是一个并行式元搜索引擎,它具有优秀的清晰性和详细的组织性,可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6个独立引擎,是简单搜索或中度复杂搜索的最佳网点。         

 

MetaCrawler的搜索功能包括:(1)支持简单搜索,性能优良;(2) 支持高级搜索;(3)支持目录搜索。搜索类型缺省为Web(万维网页),也可查Usenet (新闻论坛,选Newsgroups进入)、FTP(文件资源,选Files进入)等,特别是具有专门查询Computer Products的功能。

其特色和优势是:

① 可使用*作为通配符,支持+、-词操作,支持词组查询方式。

② 支持分类目录查询;具有专门查询Computer Products的功能。

③ 能对结果进行整理并给出结果的源数据库。缺点是分类目录搜索等均系调用InfoSpace资源,无自己组织的信息。

7)ProFusion是并行式元搜索引擎,拥有智能化的搜索技术、对查询的实用提示和非常宝贵的个人化搜索服务,它是目前最优秀的元搜索引擎,可同时调用9个独立万维网搜索引擎:AltaVista、Excite、HotBot、InfoSeek、Lycos、Magellan、OpenText、WebCrawler和Yahoo。

ProFusion的搜索功能包括:(1)支持简单搜索;(2) 支持高级搜索,性能优良;(3)不支持目录搜索。搜索类型缺省为Web(万维网页),也可查Usenet(新闻论坛)。  

其特色和优势是:

① 可选择调用3个最好的引擎(Infoseek、AltaVista、Excite)、或3个最快的引擎(Infoseek、Yahoo、Magellan)、或全部搜索引擎、或手工自选引擎进行查询。

② 自动对查询结果进行整理,删除冗余的结果,并按相关性进行排序。

③ 高级搜索健全,可使用*作为通配符,支持+、-词操作。

美中不足的只是缺少目录搜索支持。

 

原创粉丝点击