使用Windows7的索引与搜索功能

来源:互联网 发布:mac 抓包工具 编辑:程序博客网 时间:2024/06/06 09:31

不知道大家有没有这样的经历:突然想起一些以前看过的文章里的一些东西,只记着几个词,想找到原文看看或者要引用他们。为了解决这个问题,我们要一篇一篇的找吗?不,我们使用搜索功能。搜索功能可以帮助我们将文件的文本内容加入我们的搜索范围,这样,当我们搜索这两个我们突然想起来的词时,那原文就会立刻跳出来了。

这样高级的搜索功能有目前有很多中方式实现:windows7(其他版本应该也可以)自带的索引加搜索功能、Google桌面[1]。其他还有如paperport等可以索引pdf,但是与系统集成度不高,用起来感觉很不爽,在这里就不推荐了。不过paperport可是一个著名的软件,大家有兴趣可以了解下它的其他功能。下面主要介绍Windows7继承的索引与搜索功能以及Google桌面这款搜索产品。

一、Window7的索引与搜索功能。

Win7提供了无处不在的搜索框,资源管理器右上角,开始菜单中等。Win7使用的搜索是与Win7的索引功能紧密集合的。Win7的索引工具自动将规定的索引文件夹中的所有文字类文件中的内容提取出来,这个提取的过程使用的是一个称之为提取器(iFilter)的工具。对于不同格式的文件有不同的iFilter,如doc的iFilter、pdf的iFilter等。提取之后形成一个数据库,然后windows再在这个数据库中搜索我们需要的东西。如何使用Win7的索引与搜索,这里就不详细介绍了,因为别人已经写的很清楚了,请参考引文[2,3]。

下面主要说说iFilter。据消息称,Win7已经采用了Foxit公司的iFilter工具Foxit PDF ifilter作为其PDF的提取器[4],但是显然这个Foxit PDF ifilter并不是最新的2.1版本。Foxit PDF ifilter的2.1版本已经推出,而且对于个人用户,它是免费的,那么为什么不使用呢?

首先是下载,先从Foxit官方网站[5]下载这个工具。然后用常规的安装方法安装安装包,这样我们会在控制面板里的索引选项里看到PDF的提取器已经成了Foxit PDF ifilter了,如下图:

clip_image001

确定下面的红色框里选择的是“索引属性和文件内容”。最后重建索引就行了,这样索引完成后就可以正常使用搜索了。

clip_image002

二、Google桌面搜索。

Google桌面下载安装,然后就能直接用了。调出搜索框的快捷键是“Win键+F”。Google自带的pdf提取器我感觉不太好用,主要是不能将很多中文PDF文件的内容很好的提取出来。可以用IfiltershopGdsPlugin这个插件让Google桌面使用Windows系统的提取器(iFilter)。剩下的就不多说了。

另外,还要说一点事情,就是关于搜索关键字的问题。我对几个关键字进行了实验,发现这个关键字使用也有说法的。比如,我搜索“几何特征角点”就可以找到我需要的文章,但是如果我输入“何特征的角点”就找不到任何文章了。再比如“像素点为角”可以找到文章,但“素点为角”就找不到文章了。所以我总结搜索关键字中开头的词(中文)必须为整个词,不能为半个词。这大概是微软构造数据库的方法——对词进行索引。另外,我们可以以单个的字作为关键字进行搜索。

最后还有件事情,就是关于索引系统会对PDF文件的哪些域(标题、主题、关键字(meta)、正文内容等)进行索引?这个我还没有完全确定。但唯一确定的是,它肯定会对文件名和正文进行索引的。之余我们修改了文件内容之后,索引系统会不会重新索引这个文件?那还需要继续研究。

[1] http://moonlab.net/log/desktop-search-pdf.html

[2] http://www.iteeyan.com/2011/01/faster-win7-search/

[3] http://softbbs.pconline.com.cn/10722440.html

[4] http://blog.sina.com.cn/s/blog_597c26770100bp4j.html

[5] http://www.fuxinsoftware.com.cn/pdf/ifilter/

原创粉丝点击