搜索引擎
来源:互联网 发布:js杀破狼mp3下载 编辑:程序博客网 时间:2024/05/01 19:49
定义:搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。
搜索引擎的基本步骤分为4部分:
1.爬行和抓取
爬行就是搜索引擎访问很多页面,这个过程就是爬行。
抓取就是存入数据库。
2.索引
蜘蛛抓取的页面分解、分析、并以巨大的表格存入数据库,这个过程就是索引。
3.搜索词处理
用户在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对搜索词进行处理,如中文特有的分词处理,去除停止词,判断是否需要重新整体搜索,判断是否有拼写错误或错别字等情况。
4、根据算法判断,根据用户需求,关键字排序。
搜索引擎的分类。
1、全文索引是名副其实的搜索引擎,国外代表有Google,国内有著名的百度搜索。
2、目录索引按照目录分类的网站链接列表而已。
3、元搜索引擎接受用户请求后,同时在多个搜索引起上搜索,并将结构返回给用户。
5、提取网页上的内容
目前按键支持的元素特征值有这些:框架、唯一标识、标识、类型、文本、特征、索引、名字。
0 0
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- UML——概述和关系
- 蓝桥杯 连号区间数
- Nginx 學習筆記(一) 從原始碼編譯Nginx(上)
- 青岛理工大学第五届邀请赛 J: 麻烦的转盘(概率DP入门题)
- 高级CSS filters
- 搜索引擎
- Linux调试工具
- 基于iscroll.js实现下拉刷新和上拉加载特效
- 开始IOS之旅
- Struts案例动作类
- Oracle报错:类型长度大于最大值解决办法
- 利用Listview实现程序列表展示
- Binary Tree Inorder Traversal ---LeetCode
- oracle上机实验内容