影响搜索结果排序之:六个维度
来源:互联网 发布:kindle 编程书籍 编辑:程序博客网 时间:2024/05/08 05:47
百度的排序算法维度:
用户输入关键词进行检索,百度搜索引擎在排序环节要做两方面的事情,第一是把相关的网页从索引库中提取出来,第二是把提取出来的网页按照不同维度的得分进行综合排序。“不同维度”包括:
1,相关性:网页内容与用户检索需求的匹配程度,比如网页包含的用户检查关键词的个数,以及这些关键词出现的位置;外部网页指向该页面所用的锚文本等
2,权威性:用户喜欢有一定权威性网站提供的内容,相应的,百度搜索引擎也更相信优质权威站点提供的内容。
3,时效性:时效性结果指的是新出现的网页,且网页内承载了新鲜的内容。目前时效性结果在搜索引擎中日趋重要。
4,重要性:网页内容与用户检查需求匹配的重要程度或受欢迎程度
5,丰富度:丰富度看似简单却是一个覆盖范围非常广的命题。可以理解为网页内容丰富,可以完全满足用户需求;不仅可以满足用户单一需求,还可以满足用户的延展需求。
6,受欢迎程度:指该网页是不是受欢迎。
以上便是百度搜索引擎决定搜索结果排序时考虑的六大原则,那么六大原则的侧重点是怎样的呢?哪个原则在实际应用时占比最大呢?其实在这里没有一个确切的答案。在百度搜索引擎早期,这些阈值的确是相对固定的,比如“相关性”在整体排序中的重量可以占到七成。但随着互联网的不断发展,检索技术的进步,网页数量的爆发式增长,相关性已经不是难题。于是百度搜索引擎引入了机器学习机制,让程序自动产出计算公式,推进排序策略更加合理。
google使用 200 多种指标从数百万网页和内容中确定与该查询相关程度最高的答案。 Google 每年进行 500 多次改进,以完善其排名算法。
指标示例如下:
• 网站内容的及时性
• 链接到某个特定网站的其他网站的数量,以及这些网站的权威性
• 网页上的文字
• 搜索关键字的同义词
• 拼写检查
• 网站内容的质量
• 网页的网址和标题
• 最佳结果是网页、图片、视频、新闻报道还是个性化搜索结果等
• 个性化
• 由与您关联的人员推荐的结果
用户输入关键词进行检索,百度搜索引擎在排序环节要做两方面的事情,第一是把相关的网页从索引库中提取出来,第二是把提取出来的网页按照不同维度的得分进行综合排序。“不同维度”包括:
1,相关性:网页内容与用户检索需求的匹配程度,比如网页包含的用户检查关键词的个数,以及这些关键词出现的位置;外部网页指向该页面所用的锚文本等
2,权威性:用户喜欢有一定权威性网站提供的内容,相应的,百度搜索引擎也更相信优质权威站点提供的内容。
3,时效性:时效性结果指的是新出现的网页,且网页内承载了新鲜的内容。目前时效性结果在搜索引擎中日趋重要。
4,重要性:网页内容与用户检查需求匹配的重要程度或受欢迎程度
5,丰富度:丰富度看似简单却是一个覆盖范围非常广的命题。可以理解为网页内容丰富,可以完全满足用户需求;不仅可以满足用户单一需求,还可以满足用户的延展需求。
6,受欢迎程度:指该网页是不是受欢迎。
以上便是百度搜索引擎决定搜索结果排序时考虑的六大原则,那么六大原则的侧重点是怎样的呢?哪个原则在实际应用时占比最大呢?其实在这里没有一个确切的答案。在百度搜索引擎早期,这些阈值的确是相对固定的,比如“相关性”在整体排序中的重量可以占到七成。但随着互联网的不断发展,检索技术的进步,网页数量的爆发式增长,相关性已经不是难题。于是百度搜索引擎引入了机器学习机制,让程序自动产出计算公式,推进排序策略更加合理。
google的排序算法维度:
google使用 200 多种指标从数百万网页和内容中确定与该查询相关程度最高的答案。 Google 每年进行 500 多次改进,以完善其排名算法。
指标示例如下:
• 网站内容的及时性
• 链接到某个特定网站的其他网站的数量,以及这些网站的权威性
• 网页上的文字
• 搜索关键字的同义词
• 拼写检查
• 网站内容的质量
• 网页的网址和标题
• 最佳结果是网页、图片、视频、新闻报道还是个性化搜索结果等
• 个性化
• 由与您关联的人员推荐的结果
0 0
- 影响搜索结果排序之:六个维度
- 百度搜索中关键词顺序对搜索结果排序的影响
- 六个维度:代码可读性
- 六个维度:性能
- 六个维度:简洁性
- 搜索结果排序
- lucene搜索结果排序
- 影响Google搜索结果的因素
- search花絮之文本字符串搜索结果的排序
- 好代码的六个维度
- 六个维度:可移植性
- 搜索服务子系统-结果排序
- Lucene的搜索结果排序
- elasticsearch5.2搜索结果排序
- 解决搜索结果排序问题
- elasticsearch搜索之范围维度 Star.hou原创
- solr fieldLength fieldNorm精度影响搜索结果的得分
- 使用lucene对搜索结果排序
- [Golang] 从零开始写Socket Server(5):Server的解耦—通过Router+Controller实现逻辑分发
- 架构基础
- spark-kafka
- UE4 Patching
- 编译报错 Unable to recognise the format of the input file `./libs/x86_64/libxxx.so'的解决
- 影响搜索结果排序之:六个维度
- Flody算法--HDOJ-2066 -- 一个人的旅行
- PostgreSQL ODBC驱动(psqlODBC)的字符编码转换详解
- JSONObject介绍与操作
- Unreal Frontend
- 循环22~25
- sql server性能分析--执行sql次数和逻辑次数
- 腾讯WEB前端开发三轮面试经历及面试题
- 黑马程序员----------Java基础------------Collections和Arrays