我对搜索的理解

来源:互联网 发布:淘宝第三层级 编辑:程序博客网 时间:2024/05/16 00:43

我对搜索的理解:

经过这段时间和大家的交流,我对搜索这块的业务产生了新的看法。

对于个人:日常生活和工作中都会产生大量的文档,比如说我现在写的这篇文章将存放在我的本机的某个目录下,我写的汇报邮件将存放在foxmail中,应用程序的相关的文档我方在了公司的源码管理服务器内,我在网上看到了一篇不错的文章,我想收藏起来,我把它的快捷方式保存在了收藏夹里头,我平时找的一些看起来有用的文章和代码我可能会下载到本地的目录下,这些就是我们日常存储数据的方式,这些都是属于非结构化的数据。有时候,同事给我电话,让我给他找3个月以前的某一个文件,甚至5年前的某一份资料,麻烦了,我可能就在这几个月换了电脑,我原来的资料在另外台电脑上,我有可能放在了另外一个移动硬盘里头,我得让他下班后给我电话提醒我在另外的硬盘中寻找。甚至我都不记得在那个硬盘里放了,于是我得把所有可能存放的地方都找一遍,最后找到了,给他发过去,如果照不到,那可能真的丢失了宝贵的资料,就算过段时间找到它,也可能失去了时效性,也许下次再要的时候我还得重复这些搜索的工作。

对我个人而言,我需要一个统一存储的环境,最好我能转发给别人,只需要一个地方,而不是让我翻本地email,邮件网站中各个帐户上的email,我的电脑,各个移动硬盘,光盘,浏览器中的收藏夹(我用两种浏览器),最好是私密的,这样的存储空间只有我能管理,如果有这样的东西,我想我可以节约更多的时间进行我的工作,不是么?搜索这么多地方,很耗费我和孩子单独相处的时间,耗费我学习的时间,耗费我编写代码的时间。对了它还应该帮我自动分类,因为我不想这个地方选择一下,那个选择一下,甚至让我建目录,这样会让我觉得很繁琐,时间长了,我也不知道放在那个分类了,还不如自动帮我分类存储。

 

       对于企业:我给企业做了11年的软件开发,目的就是一个,解决结构化数据管理,结构化就是可以用关系型数据库表现的数据,可以用来统计,分类,计算等数据。从最初的单机管理,到Client/Server模式,再到B/S模式,从分散应用,到企业数据总线,再到服务集中(SOA)等方式,企业在结构化数据管理上已经走向了很高的应用水平,很少有一个统一的非结构化数据存储,分类,检索的环境。他们需要么??

       他们需要,我参加过一个水利行业的项目建设,他们当时提出了一个叫做目录体系结构的系统,主要是帮助分类存放,关于水利行业的各项文件,法律法规的,工程建设的,工程图纸,历年洪水灾害情况等,他们需要一个分类,可以更方便的将来自各个部门,专业的文档资料,将他们分类管理,统一存放,并可以设定一定的权限。也有的企业已经进行了这种类似的建设,但大部分没有将文档信息进行统一管理,也许这个部门需要一套工程建设的文档管理,那个部门需要建设一套法律法学的文档管理系统。也许各个部门之间并不希望在未经过授权的情况下自己部门的资料被浏览,如果你需要某个文档,他可以从统一的资料管理中寻找到,并给你转发,也许给你发的只是阅读权利,你甚至无权下载,无法打印。

       除了自身的资料外,他们还需要查询到更多的外部资料,如果有一个入口,能够让他们在浩瀚的文献库中寻找到,可能是一本书,或者是一份杂志上的某篇文章,我只需要其中的某一部分,但我可能为了这一部分需要付出高昂的代价,我可能去单位的图书室去翻查,但我忘记了这本杂志是哪一期的,我得不停的翻,当然找到了最好,就算有点破旧能找到就不错了,要是没有找到,或者被人借走那就要耗费我半天的时间。甚至我需要去某个出版社让他们从从仓库中帮我寻找到那份让我想要的资料。如果给我一个入口,只需要花费很小的代价,却能让我寻找到我想要的内容,那么我相信我的工作效率会提高很多。

       再扩展一下,如果是一个统一的订阅呢,寻找已有的知识是足够了,未知的知识呢?知道么,我每年给我们家订阅的杂志的费用是300块,每月我都会购买《程序员杂志》,15块钱一份,一斤猪肉的价格,但里面的内容可能只有一部分对我有用,可能某些内容过段时间对我有用,但是我要重新找的话还得把书柜翻个遍,所以我养成了每年购买合订本的习惯。如果,这些杂志我在网上订阅,每个月给我推送的形式,变成我自己私密的文档,当我需要查询,提供非常方便查找的功能,而且代价很小的话,我相信我会很乐意去在网上订阅。

       等等,还有一个问题,我喜欢在床上看书,在沙发上看书,未来会有很多设备支持我在各个地方看书,现在的汉王书,ipad将走入寻常百姓家,就像家用电脑一样。如果我的文档资料都能够在这些设备上看到就更好了。

 

归纳一下,我心目中的未来的文档管理是一个能够满足以下需求的产品:

1.海量文档存储,支持自动分类

2.多文档结构存储(来源不限,可以是email,word ,excel,网页等)

3.良好的收集功能,比如说给定一个网页地址,它自动帮忙采集内容,可以在收到email,或者阅读某篇word文档时候把它扔给某一个系统,它自动帮我存储。

4.良好的搜索,给定一个词,可以根据词义去找到我想要的内容

5.可以帮助企业建立知识库

6.可以搜索浩瀚的外部文档

7.可以帮我订阅杂志

8.在很多地方我都能够方便的去浏览资料,无论是在家,还是在单位。在各种设备,手持的,台式机等。

原创粉丝点击