搜索引擎认识

来源:互联网 发布:ps合成是什么软件 编辑:程序博客网 时间:2024/04/29 19:11

        在csdn和风行资讯网都看到了这些内容,主要介绍了第二代搜索引擎的相关缺点和第三代搜索引擎的大致轮廓。google的pagerank算法可以算得上是第二代搜索引擎的典型代表了。同时列举了第二代搜索引擎的相关局限,主要叙述了以下四个方面:(1)提供的提问函数相当有限。例如,雅虎只提供与、或运算,并且一旦选用了一个逻辑运算符,即必须应用于所有的关键词;再如,百度搜索仅支持与、或、非布尔表达式,而不支持异或,也不支持关键词之间的位置检索或者勾选搜索结果。(2)仅支持单个关键词或者一组关键词及逻辑运算符组成提问,而并不支持自然语言搜索或语义搜索。以百度为例,百度搜索支持字串搜索,当用户输入一段话进行查询时,百度会将其切分成多个词,按照逻辑“与”的关系进行关键词搜索,但搜索结果充其量仅能做到差强人意。所以如此,是因为关键词搜索本身并不是基于对内容的理解,所以关键词与搜索结果之间的匹配很难做到精准,往往是搜到哪算哪。(3)不能利用历史信息进行搜索。用户的每次搜索都是从头开始,而不能从原有的查询结果中作进一步选择;(4)呈现方式单一、呆板。多数搜索引擎只返回一个长长的搜索结果列表,其中可能有数以万计的包含关键词的网页,但这些网页是否以及在多大程度上与用户的搜索意图相关,则不得而知。

         同时还对第三代搜索引擎进行相关预言。(1)更精准、更个性化的搜索:借鉴Autonomy的模式识别技术以及自动分类等功能,如Clusty、Grokker、Snap、Dogpile;在美国颇受用户赞誉的另一个搜索引擎swicki;这种搜索方式就是自动分类、聚类等功能。(2)呈现方式:如Google趋势搜索以及百度指数;需要语义分析技术和部分人工智能技术。

原创粉丝点击