分布式重复检测系统构思

来源:互联网 发布:美国大学放假知乎 编辑:程序博客网 时间:2024/05/21 09:23

在说构思之前,先讲讲元数据的概念。

元数据(MetaData)是关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息,

所有这些信息都应当妥善保存,并很好地管理。为数据仓库的发展和使用提供方便。

元数据是一种二进制信息,用以对存储在公共语言运行库可移植可执行文件(PE)或存储在内存中的程序进行描述。将您的代码编译为PE文件时,便会将元数据插入到该文件的一部分中,

而将代码转换为Microsoft中间语言(MSIL)并将其插入到该文件的另一部分中。在模块或程序集中定义和引用的每个类型和成员都将在元数据中进行说明。当执行代码时,运行库将元数据加载到内存中,并引用它来发现有关代码的类、成员、继承等信息。

每个人都会用到的一个东西,上传和下载功能,那么在上传的时候,如果每次都直接上传,那么很有可能会出现重复上传的情况,也就是说会消耗无辜的流量。

那么,应该怎么做,应该在每次上传的时候,做的第一件事情,不是直接上传,而是将你要上传文件的相关信息传到服务器端,然后服务器进行判断,此文件是否

已经存在了,如果已经存在了,那么就不需要重复上传。这样子,就可以节省一定的通信流量,也能提高效率。