搜索引擎
来源:互联网 发布:破解网络尖兵软件 编辑:程序博客网 时间:2024/05/01 14:15
搜索引擎软件可以分成以下几个模块:
-- 攫取(fetching):就是把被指向的网页下载下来。
-- 数据库:保存攫取的网页信息,比如那些网页已经被攫取,什么时候被攫取的以及他们又有哪些链接的网页等等。
-- 链接分析:对刚才数据库的信息进行分析,给每个网页加上一些权值(比如PageRank,WebRank什么的),以便对每个网页的重要性有所估计。不过,在我看来,索引那些网页标记(Anchor)里面的内容更为重要。(这也是为什么诸如Google Bombing如此高效的原因)
-- 索引(Indexing): 就是对攫取的网页内容,以及链入链接,链接分析权值等信息进行索引以便迅速查询。
-- 搜索(Searching): 就是通过一个索引进行查询然后按照网页排名显示。
当然,为了让搜索引擎能够处理数以亿计的网页,以上的模块都应该是分布式的。也就是说,可以在多台机器上并行运行。
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 搜索引擎
- 服务器配置
- WPF 使用正字表达式
- JAVA反射机制
- 软件设计缺陷的根源
- 深入浅出学习Hibernate框架(一):从实例入手初识Hibernate框架
- 搜索引擎
- 彻底搞定C指针-函数名与函数指针
- Android JNI简单实例(android 调用C/C++代码)
- Flex4在datagrid单元格中添加按钮/图片等丰富内容
- 微软安全新闻聚焦-双周刊第十三期
- dockpanel
- Eloquant Javscript读书笔记
- J2ME游戏如何快速移植到Android
- 雷迪嘎嘎:巴西推出智能校服,妈妈再也不用担心孩子逃课了