桌面搜索引擎!

来源:互联网 发布:js span 编辑:程序博客网 时间:2024/05/01 22:58

2.基本要求

A)支持对操作系统中的多个文件夹下面存储的文本文件(.txt文件和.html文件)建立索引,比如可以对c: /下面存储的所有文本文件建立索引。

B) 支持对中文文本文件的索引,采用中文分词算法从中文文本中提取关键词。可以参考http://ictclas.org/分词系统,或其他分词方法。

C) 提供多种复合搜索功能,其中包括与搜索:输入多个关键词,返回同时包含这些关键词的文件的文件名;或搜索:输入多个关键词,返回至少包含其中一个关键词的文件的文件名。

D) 提供图形化使用界面。对搜索结果的呈现采用类似于google的搜索结果的呈现方法,除了返回命中文件的文件名,还可以输出包含有搜索关键词的相关句子。

 

3.增强要求

A) 支持子索引文件。当索引的文件内容较多的情况下,索引文件太大,需要分裂为多个子索引文件。

B) 支持边索引边检索。在建立索引的过程中,也能使用该搜索引擎进行检索。

C) 支持文件的删除。(当对文件夹中的某个文件进行删除的时候,我们需要从索引文件中删除该文件的记录)。该删除操作要求尽可能高效率的进行。具体实现上可以先不删除,而是打上标记使得搜索不到;然后在空闲的时候,进行整理,将打上标记的记录清理掉。

D) 支持分页搜索。类似于google搜索,搜索结果的前10名构成第1页,11-20构成第2页,依次类推。可以指定页数,返回该页的搜索结果。

E) 支持缓存,对经常查的关键字, 能够比一般关键字更加快速的给出结果。

 

4.扩展要求

A) 能够支持更多文件格式的索引和搜索。如pdf文件,doc文件,bmp文件(可对其文件名建立索引)等等。

B) 能够定期检测文件夹下的文件是否发生更改,如果有,则相应的更改索引,以使得搜索的结果和实际的文件内容相一致。

 

 

这个是要求!我想采用c#弄这个东西!

 

 

然后我咨询了一下某人;他给我的答复:

 

1. 你先要能打开那些文件并提取出其中的文本

因此文件这一块要抽象出一个接口

2. 用一个数据库存储所有文件所有关键词的词频

3. 用ASP.Net去呈现

或者你想用java也

 

 

那如果我不懂asp.NET,那又想用asp.NET去实现的话,那我只要看asp。net的书就可以了么?

你就一定要看asp.net的书

但不是只看

那asp.NET的那类书呢?很多哦!

哪类?

你要是可以看MSDN干脆直接看MSDN

入门的,高级编程的。web。还是window程序开发

asp.net就是asp.net

你说的这些都不是

呃、、、、

你学asp。net是看msdn的?

我没学

哦!我乖乖看我 c#

 

 

 

 

原创粉丝点击