0%

粗糙集理论学习笔记

粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画。


基本粗糙集理论的主要存在的问题:
1)对原始数据本身的模糊性缺乏相应的处理能力;
2)对于粗糙集的边界区域的刻画过于简单;
3)粗糙集理论的方法在可用信息不完全的情况下将对象们归类于某一具体的类,通常分类是确定的,但并未提供数理统计中所常用的在一个给定错误率的条件下将尽可能多的对象进行分类的方法,而实际中常常遇到这类问题。


该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息,所以对问题的不确定性的描述或处理可以说比较客观。


论域:包含若干对象的非空有限集。
概念:任意集合X属于论域U为一个概念。
空概念:一个空集视为空概念。
知识:由任意个这样的X组成的自己簇形成了论域中抽象知识,是一种能力,用来分类对象。
对象:任何实体,物品、属性、概率等。
不可定义集:对于论域U上任意一个子集X,X不一定能用知识库中的知识来精确表达。


信息系统四元组(U,Q,V,f),其中
U是对象集合,
Q是属性集合(包括条件属性C和决策属性D),
V是属性的值域,
f是一种映射,反应对象集合之间的值。

U a b c d e
1 1 0 1 2 0
2 0 1 1 1 2
3 2 0 0 1 1
4 1 1 0 2 2
5 1 0 1 0 1
6 2 2 0 1 1
7 2 1 1 1 2
8 0 1 1 0 1

U = (1,2,3,4,5,6,7,8)
Q = (a,b,c,d,e)
V = (0,1,2)
U/Ind(a) = ((1,4,5),(2,8),(3,6,7)),由条件属性a决定对U的划分。
U/Ind(a,b,c)=((1,5),(2,8),(3),(4),(6),(7))
(x,y)IND(P)(x,y)\in IND(P),则称x和y是P不可分辨的,即依据P中所含各属性无法将x和y区分开。比如2和8无法依据属性a分开。


假定关于论域的某种知识,并使用属性和属性值来描述论域中的对象,如果两个对象(或对象集合)具有相同的属性和属性值,则它们之间具有不可分辨关系。


一般约简
决策表T=(U,P,C,D)中条件属性集C的一个子集B是关于D独立的,并且PosB(D)=PosC(D),则称B是C的一个D约简(reduct),B和C在D上的效果是一样的。将所有类似B这样的约简子集求交集即可得到属性集合C的核(Core)。
核的意义:
(1)因为核包含于所有约简之中,所以核可以作为所有约简的计算基础。
(2)核在知识约简中是不能消去的特征集合。

-------------本文结束感谢您的阅读-------------

欢迎关注我的其它发布渠道