粒计算

来源:互联网 发布:白银理财投资数据分析 编辑:程序博客网 时间:2024/05/03 05:56

背景

粒度信息的必要性

举个例子:合适的粒度常常是由问题本身及问题背景决定的, 这一点对设计基于粒计算的数据处理框架有重要意义. 举一个关于时间的例子, 例如张先生问他的朋友:“ 你什么时候回国的”, 回答这个问题所选择的时间粒度其实是由他朋友回国的时间到现在有多久决定的. 如果没超过一天, 那么他会说:“ 昨天中午”;如果有十天左右了, 他可以说:“ 上周”; 再如果是朋友回国好几年了, 张先生才得知消息, 那么“ 2009年”就可以是一个满意的答案了. 注意到上面几个答案具有不同的粒度, 分别是午、 周和年. 如果不采用合适的粒度, 统一都用计算机上常见的时间戳格式来回答, 如:“ 2013年4月29日下午3时25分”, 就不太合理, 让人觉得别扭.(因此,粒度的划分需要适应求解的问题。)

传统的数据挖掘技术总是在最细粒度的原始数据上进行分析, 而粒计算观点则认为选择与问题相适应的粒度空间有助于提高求解的质量和求解的时空效率.

追根溯源

20 世纪 70 年代到 80年代初 , 人们将物理学中把大型物质划分为颗粒、分子、原子的思想引入到信息领域,用于处理现实世界中的不精确、不完整的海量信息以实现智能系统或智能控制。

人类智能的一个公认特点, 就是人们能从极不相同的粒上观察和分析同一问题。 人们能在不同粒的世界上进行问题求解, 且能够很快地从一个粒世界跳转到另一个粒世界, 往返自如, 毫无困难。 这种处理不同粒世界的能力, 正是人类问题求解的强有力的表现。 从真实世界看, 许多自然系统、社会系统、人工系统都是基于层次的, 粒计算可以真实自然地表示这类系统。 从简化问题看, 多层系统的不同层次关注不同的粒特征, 粒计算忽略了不必要和不相关的细节, 只关注适当层次, 从而简化了问题。 从实用角度看, 许多问题是不完整的、不确定的, 或者含有模糊信息, 很难区分元素, 只能认为是粒。 且在许多实际问题中也不要求精确解, 或者获取精确信息的代价不菲, 为了提高效率和降低代价, 粒计算是合适的。

粒计算的基本问题

粒计算的基本问题有: 粒的构建和粒的计算。 前者说明粒的内涵和外延, 后者处理问题求解方面粒计算的应用。

粒的内涵主要是说明粒的语义, 它解释两个对象为什么属于或不属于同一个粒。 如, 一个粒的元素通过不可分辨性、相似性、近似性或功能性聚集起来[2]。同时, 也必须为诸如不可分辨性、相似性、近似性的概念提供必要的语义说明, 还需要研究从论域的各种粒中可引出的粒结构。 粒的外延即表示形式, 解决算法问题: 如何将两个对象合并到同一粒中去, 如何将论域中对象分解为不同粒。 由此, 粒化标准、粒化方法、粒化解释、粒化评估都是要解决的问题。

粒的计算从语义和算法两个角度来研究。 一方面, 要求解释说明粒之间的各种关系, 如闭合性、独立性和关联性, 并定义和解释粒的运算符; 另一方面, 要求设计处理粒的方法论和工具, 如近似、推理和推论以及不同层次粒间的映射、转换、运算、属性继承等。

概念

从多粒度计算 [36,37] 的角度看 , 该计算模型大体由粒子、粒层和粒结构三个部分组成。

粒计算模型构成的最基本元素是粒子 [38,39], 它是粒计算模型的原语。每个粒子都可被同时看作是由内部属性描述的个体元素的集合和由它的外部属性所描述的整体,以及由它的环境属性描述的对外界动态变化环境的回应。粒度是将性质相似的元素归结为一个新元素,用来衡量粒子“尺度”的概念,它反映了粒子进行“量化”时的粒化程度 [39]。

粒层是按照粒化准则得到的所有粒子的全体 , 是对现实空间的一种抽象化描述。根据具体的关系或算子 , 问题空间产生相应的粒子。同一层的粒子内部具有某些相同的性质或功能 . 但是粒化程度的不同 , 也会导致同一问题空间产生不同的粒层 . 在问题求解中 , 选择最合适的粒层对于问题求解尤为关键。在不同粒层上进行问题求解 , 并且不同粒层上的解能够相互跳转。

0 0
原创粉丝点击