搜索引擎(一):基本知识
来源:互联网 发布:免备案免费php空间 编辑:程序博客网 时间:2024/04/30 08:00
爬虫:
网络机器人,网络爬虫,是一种自动获取网页内容的程序,是搜索引擎的重要组成部分。
信息检索的过程
1.建立文本库
2.建立索引
3.进行搜索
4.返回结果前,对结果进行过滤
倒排索引
倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。
- 搜索引擎(一):基本知识
- ORACLE基本知识(一)
- Spread基本知识(一)
- USB基本知识(一)
- C++基本知识(一)
- USB 基本知识(一)
- Hibernate基本知识(一)
- USB 基本知识(一)
- 前端基本知识(一)
- NDK基本知识(一)
- java基本知识(一)
- Redis基本知识(一)
- (一)基本知识
- elasticsearch(一) 基本知识
- 数据库基本知识(一)
- (一)SQL基本知识
- Android基本知识(一)
- JSP基本知识(一)
- 给初学C++者的50条忠告
- uva 565 Pizza Anyone?
- 自然数拆分
- 数据结构之递归打印实数
- NYOJ-255-C小加 之 随机数-2013年10月18日17:19:41
- 搜索引擎(一):基本知识
- HTTPClient实现java自动登录人人网
- 1
- 常用的Objective-C特性检查
- 【天梯 - Wikioi】2235 机票打折
- 输入三角形三边长,判断是否能组成三角形,并输出面积
- hdu 1179最大匹配
- linux中interfaces文件auto和auto-hotplug区别
- SDRAM的寻址知识及重要的参数