粗糙集理解之二:属性约简

来源:互联网 发布:dnf角色身高官方数据 编辑:程序博客网 时间:2024/05/02 01:23
 
由上一节可以知道,粗糙集是处理模糊数据的有力工具,而要达到这样的目的需要有两个重要的步骤来进行处理—属性约简和值约简,属性约简是对粗糙集合(那些不能区分的集合)进行纵向的简化,把不必要的属性去掉,即去掉这些属性也不会影响对象的区分能力,这样便于以后进一步的简约处理
关于属性约简的一些基本概念
1.由上节的可区分的概念引申出来:如果在整个信息系统S(即带所有P的所有U)上所有Ui 都互不相等,那么就称为这个SP下是可分辨的,一般记作ind(P)
解释:这个标号说明是在P这个条件集合下是可分辨的,而且另一个P’下可能不可分辨,所以在对于一个S是否分辨取决于它的属性集合,因此ind(P)只需一个参数P即可
2. 如果去掉P中的某个属性集合Pi,系统S仍然是可以分辨的,那么P中的Pi是可以简约的,一般记作indP-Pi=indP
3. 如果P中的任何一条属性都是不可简约的,那么就称P是独立的
解释:P是独立的说明P中的任何一个属性都是必不可少的,它独立的表达一个系统分类的特征。文献[3]
算法
属性约简的算法分析:
开发环境: myeclipse 数据库mysql
函数说明:函数名attriSimpl() 无参数,返回属性简化后的数据
初始状态:所有数据已存入数据库(以下为模拟数据)
U
a
b
c
d
e
1
1
0
0
1
1
2
1
0
0
0
1
3
0
0
0
0
0
4
1
1
0
1
0
5
1
1
0
2
2
6
2
1
0
2
2
7
2
2
2
2
2
现在设e为决策属性,其他为条件属性,即对于不同的对象,不同的条件属性的组合会对决策属性有怎么样的影响?
算法思路:
基本假设是能影响属性e的只有a,b,c,d四个(即系统在a,b,c,d,e下可区分)
基本原则是如果所有的条件属性都是一样的两个对象其决策属性也应该是一样的(因为否则说明这个对象还有能影响其决策属性的条件属性未被列入表内)
那么如果去掉某个条件属性,对于任意两个不同的决策属性其他属性都不同,那么这个属性冗余,否则这个属性必需(即前面的概念2)
 
原创粉丝点击