粗糙集-智能科学网站课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《粗糙集-智能科学网站课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 粗糙 智能 科学 网站 课件
- 资源描述:
-
1、2022-8-6高级人工智能 史忠植1知识发现(数据挖掘知识发现(数据挖掘)第七章第七章 史忠植史忠植 中国科学院计算技术研究所 粗粗 糙糙 集集 Rough SetRough Set 2022-8-6高级人工智能 史忠植2内容提要内容提要一、概述二、知识分类三、知识的约简四、决策表的约简五、粗糙集的扩展模型六、粗糙集的实验系统七、粒度计算简介2022-8-6高级人工智能 史忠植3一、一、概述概述 现实生活中有许多含糊现象并不能简单地用真、假值来表示如何表示和处理这些现象就成为一个研究领域。早在1904年谓词逻辑的创始人G.Frege就提出了含糊(Vague)一词,他把它归结到边界线上,也就是
2、说在全域上存在一些个体既不能在其某个子集上分类,也不能在该子集的补集上分类。2022-8-6高级人工智能 史忠植4模糊集模糊集 1965年,Zadeh提出了模糊集,不少理论计算机科学家和逻辑学家试图通过这一理论解决G.Frege的含糊概念,但模糊集理论采用隶属度函数来处理模糊性,而基本的隶属度是凭经验或者由领域专家给出,所以具有相当的主观性。2022-8-6高级人工智能 史忠植5粗糙集的提出粗糙集的提出 20世纪80年代初,波兰的Pawlak针对G.Frege的边界线区域思想提出了粗糙集(Rough Set)他把那些无法确认的个体都归属于边界线区域,而这种边界线区域被定义为上近似集和下近似集之
3、差集。由于它有确定的数学公式描述,完全由数据决定,所以更有客观性。2022-8-6高级人工智能 史忠植6粗糙集的研究粗糙集的研究 粗糙集理论的主要优势之一是它不需要任何预备的或额外的有关数据信息。自提出以来,许多计算机科学家和数学家对粗糙集理论及其应用进行了坚持不懈的研究,使之在理论上日趋完善,特别是由于20世纪80年代末和90年代初在知识发现等领域得到了成功的应用而越来越受到国际上的广泛关注。2022-8-6高级人工智能 史忠植7粗糙集的研究粗糙集的研究 1991年波兰Pawlak教授的第一本关于粗糙集的专著Rough Sets:Theoretical Aspects of Reasonin
4、g about Data 和1992年R.Slowinski主编的关于粗糙集应用及其与相关方法比较研究的论文集的出版,推动了国际上对粗糙集理论与应用的深入研究。1992年在波兰Kiekrz召开了第1届国际粗糙集讨论会。从此每年召开一次与粗糙集理论为主题的国际研讨会。2022-8-6高级人工智能 史忠植82001年5月在重庆召开了“第1届中国Rough集与软计算学术研讨会”,邀请了创始人Z.Pawlak教授做大会报告;2002年10月在苏州第2届中国粗糙集与软计算学术研讨会2003年5月在重庆 第3届中国粗糙集与软计算学术研讨会 2004年10月中下旬在浙江舟山召开第4届中国粗糙集与软计算学术研
5、讨会 2005年8月1日至5日在鞍山科技大学召开第五届中国Rough集与软计算学术研讨会(CRSSC2005)2006第六届中国粗糙集与软计算学术研讨会在 浙江师范大学2022-8-6高级人工智能 史忠植92007年粗糙集与软计算、Web智能、粒计算联合学术会议,山西大学2008年第8届中国粗糙集与软计算学术会议、第2届中国Web智能学术研讨会、第2届中国粒计算学术研讨会联合学术会议(CRSSC-CWI-CGrC2008),河南师范大学 中科院计算所、中科院自动化所、重庆邮电学院、南昌大学、西安交通大学、山西大学、合肥工业大学、北京工业大学、上海大学2022-8-6高级人工智能 史忠植10 曾
6、黄麟.粗集理论及其应用(修订版).重庆:重庆大学出版社,1998 刘清.Rough Set及Rough推理.北京:科学出版社,2001 张文修等.Rough Set理论与方法.北京:科学出版社,2001 王国胤.Rough Set理论与知识获取.西安:西安交通大学出版社,2001 史忠植.知识发现.北京:清华大学出版社,2002 豫.粒计算-过去现在与展望.科学出版社,20072022-8-6高级人工智能 史忠植11二、二、知识分类知识分类基本粗糙集理论认为知识就是人类和其他物种所固有的分类能力。基本粗糙集理论认为知识就是人类和其他物种所固有的分类能力。例如,在现实世界中关于环境的知识主要表明
7、了生物根据其生存观来对各种各样的情形进行分类区别的能力。每种生物根据其传感器信号形成复杂的分类模式,就是这种生物的基本机制。分类是推理、学习与决策中的关键问题。因此,粗糙集理论假定知识是一种对对象进行分类的能力。这里的“对象”是指我们所能言及的任何事物,比如实物、状态、抽象概念、过程和时刻等等。即知识必须与具体或抽象世界的特定部分相关的各种分类模式联系在一起,这种特定部分称之为所讨论的全域全域或论域论域(universeuniverse)。对于全域及知识的特性并没有任何特别假设。事实上,知识构成了某一感兴趣领域中各种分类模式的一个族集(family),这个族集提供了关于现实的显事实,以及能够从
8、这些显事实中推导出隐事实的推理能力。2022-8-6高级人工智能 史忠植12二、二、知识分类知识分类 为数学处理方便起见,在下面的定义中用等价关系来代替分类。一个近似空间近似空间(approximate space)(或知识库知识库)定义为一个关系系统(或二元组)K K=(U,R R)其 中 U (为 空 集)是 一 个 被 称 为 全 域 或 论 域(universe)的所有要讨论的个体的集合,R R是U上等价关系的一个族集。2022-8-6高级人工智能 史忠植13二、二、知识分类知识分类 设P PR R,且P P ,P P中所有等价关系的交集称为P P上的一种不可区分关系(indiscer
9、nbility relation)(或称难区分关系),记作IND(P P),即 xIND(p)=xR RP 注意,IND(P P)也是等价关系且是唯一的。2022-8-6高级人工智能 史忠植14二、二、知识分类知识分类 给定近似空间K K=(U,R R),子集XU称为U上的一个概念概念(concept),形式上,空集也视为一个概念;非空子族集P PR R所产生的不分明关系IND(P P)的所有等价类关系的集合即U/IND(P P),称为基本知识基本知识(basic knowledge),相应的等价类称为基本概念基本概念(basic concept);特别地,若关系QR R,则关系Q就称为初等知
10、识初等知识(elementary knowledge),相应的等价类就称为初等概念初等概念(elementary concept)。一般用大写字母P,Q,R等表示一个关系,用大写黑体字母P P,Q Q,R R等表示关系的族集;xR或R(x)表示关系R中包含元素xU的概念或等价类。为了简便起见,有时用P P代替IND(P P)。根据上述定义可知,概念即对象的集合,概念的族集(分类)就是U上的知识,U上分类的族集可以认为是U上的一个知识库,或说知识库即是分类方法的集合。2022-8-6高级人工智能 史忠植15二、二、知识分类知识分类 粗糙集理论与传统的集合理论有着相似之处,但是它们的粗糙集理论与传
11、统的集合理论有着相似之处,但是它们的出发点完全不同。传统集合论认为,一个集合完全是由其出发点完全不同。传统集合论认为,一个集合完全是由其元素所决定,一个元素要么属于这个集合,要么不属于这元素所决定,一个元素要么属于这个集合,要么不属于这个集合,即它的隶属函数个集合,即它的隶属函数 X X(x x)0,10,1。模糊集合对此做了。模糊集合对此做了拓广,它给成员赋予一个隶属度,即拓广,它给成员赋予一个隶属度,即 X X(x x)0,10,1,使得模,使得模糊集合能够处理一定的模糊和不确定数据,但是其模糊隶糊集合能够处理一定的模糊和不确定数据,但是其模糊隶属度的确定往往具有人为因素,这给其应用带来了
12、一定的属度的确定往往具有人为因素,这给其应用带来了一定的不便。而且,传统集合论和模糊集合论都是把隶属关系作不便。而且,传统集合论和模糊集合论都是把隶属关系作为原始概念来处理,集合的并和交就建立在其元素的隶属为原始概念来处理,集合的并和交就建立在其元素的隶属度度maxmax和和minmin操作上,因此其隶属度必须事先给定(传统集操作上,因此其隶属度必须事先给定(传统集合默认隶属度为合默认隶属度为1 1或或0 0)。在粗糙集中,隶属关系不再是一)。在粗糙集中,隶属关系不再是一个原始概念,因此无需人为给元素指定一个隶属度,从而个原始概念,因此无需人为给元素指定一个隶属度,从而避免了主观因素的影响。避
13、免了主观因素的影响。2022-8-6高级人工智能 史忠植16Information Systems/TableslIS is a pair(U,A)lU is a non-empty finite set of objects.lA is a non-empty finite set of attributes such that for every l is called the value set of a.aVUa:.AaaV Age LEMSx 16-30 50 x2 16-30 0 x3 31-45 1-25x4 31-45 1-25x5 46-60 26-49x6 16-30 26
14、-49x7 46-60 26-492022-8-6高级人工智能 史忠植17Decision Systems/TableslDS:l is the decision attribute(instead of one we can consider more decision attributes).lThe elements of A are called the condition attributes.Age LEMS Walkx 16-30 50 yes x2 16-30 0 no x3 31-45 1-25 nox4 31-45 1-25 yesx5 46-60 26-49 nox6 1
15、6-30 26-49 yesx7 46-60 26-49 no),(dAUTAd 2022-8-6高级人工智能 史忠植18Issues in the Decision Tablel相同或不可区分的对象可能被表示多次相同或不可区分的对象可能被表示多次The same or indiscernible objects may be represented several times.l有些属性可能是多余的 Some of the attributes may be superfluous.2022-8-6高级人工智能 史忠植19不可区分性不可区分性IndiscernibilitylThe equi
16、valence relation A binary relation which is reflexive(xRx for any object x),symmetric(if xRy then yRx),and transitive(if xRy and yRz then xRz).lThe equivalence class of an element consists of all objects such that xRy.XXRXxXyRx2022-8-6高级人工智能 史忠植20不可区分性不可区分性Indiscernibility(2)lLet IS=(U,A)be an infor
17、mation system,then with any there is an associated equivalence relation:where is called the B-indiscernibility relation.lIf then objects x and x are indiscernible from each other by attributes from B.lThe equivalence classes of the B-indiscernibility relation are denoted by AB)()(,|),()(2xaxaBaUxxBI
18、NDIS)(BINDIS),(),(BINDxxIS.Bx2022-8-6高级人工智能 史忠植21不可区分性实例不可区分性实例 IndiscernibilitylThe non-empty subsets of the condition attributes are Age,LEMS,and Age,LEMS.lIND(Age)=x1,x2,x6,x3,x4,x5,x7lIND(LEMS)=x1,x2,x3,x4,x5,x6,x7lIND(Age,LEMS)=x1,x2,x3,x4,x5,x7,x6.Age LEMS Walkx 16-30 50 yes x2 16-30 0 no x3 3
19、1-45 1-25 nox4 31-45 1-25 yesx5 46-60 26-49 nox6 16-30 26-49 yesx7 46-60 26-49 no2022-8-6高级人工智能 史忠植22概念的边界概念的边界 知识的粒度性是造成使用已有知识不能精确地表示知识的粒度性是造成使用已有知识不能精确地表示某些概念的原因。这就产生了所谓的关于不精确的某些概念的原因。这就产生了所谓的关于不精确的“边界边界”思想。著名哲学家思想。著名哲学家FregeFrege认为认为“概念必须概念必须有明确的边界。没有明确边界的概念,将对应于一有明确的边界。没有明确边界的概念,将对应于一个在周围没有明确界线的
20、区域个在周围没有明确界线的区域”。粗糙集理论中的。粗糙集理论中的模糊性就是一种基于边界的概念,即一个不精确的模糊性就是一种基于边界的概念,即一个不精确的概念具有模糊的不可被明确划分的边界。概念具有模糊的不可被明确划分的边界。为刻画模为刻画模糊性,每个不精确概念由一对称为上近似与下近似糊性,每个不精确概念由一对称为上近似与下近似的精确概念来表示,它们可用隶属函数定义的精确概念来表示,它们可用隶属函数定义2022-8-6高级人工智能 史忠植23粗糙集的基本定义粗糙集的基本定义 知识的分类观点 粗糙集理论假定知识是一种对对象进行分类的能力。而知识必须与具体或抽象世界的特定部分相关的各种分类模式联系在
21、一起,这种特定部分称之为所讨论的全域全域或论域论域(universeuniverse)。为数学处理方便起见,在下面的定义中用等价关系来代替分类。2022-8-6高级人工智能 史忠植24粗糙集的基本定义粗糙集的基本定义定义定义1 1 一个近似空间近似空间(approximate space)(或知知识库识库)定义为一个关系系统(或二元组)K K=(U,R R),其中U(为空集)是一个被称为全域或论域(universe)的所有要讨论的个体的集合,R R是U上等价关系的一个族集。定义定义2 2 设P PR R,且P P,P P中所有等价关系的交集称为P P上的一种不分明关系(indiscernbil
22、ity relation)(或称不可区分关系),记作IND(P P)P PP PRR)(xxIND2022-8-6高级人工智能 史忠植25粗糙集的基本定义粗糙集的基本定义 定义定义3 3 给定近似空间K K=(U,R R),子集XU称为U上的一个概念概念(concept),形式上,空集也视为一个概念;非空子族集P PR R所产生的不分明关系IND(P P)的所有等价类关系的集合即U/IND(P P),称为基本基本知识知识(basic knowledge),相应的等价类称为基本基本概念概念(basic concept);特别地,若关系QR R,则关系Q就称为初等知识初等知识(elementary
23、 knowledge),相应的等价类就称为初等概念初等概念(elementary concept)。2022-8-6高级人工智能 史忠植26上近似、下近似和边界区域上近似、下近似和边界区域定义定义5:X的下近似:R*(X)=x:(xU)(xRX)X的上近似:R*(X)=x:(xU)(xRX)X的边界区域:BNR(X)=R*(X)R*(X)若BNR(X),则集合X就是一个粗糙概念。下近似包含了所有使用知识R可确切分类到X的元素,上近似则包含了所有那些可能是属于X的元素。概念的边界区域由不能肯定分类到这个概念或其补集中的所有元素组成。POSR(X)=R*(X)称为集合X的R-正区域正区域,NEGR
24、(X)=UR*(X)称为集合X的R-反区域反区域。2022-8-6高级人工智能 史忠植27Lower&Upper Approximations(2):/XYRUYXR:/XYRUYXRLower Approximation:Upper Approximation:上近似、下近似和边界区域上近似、下近似和边界区域2022-8-6高级人工智能 史忠植28新型的隶属关系新型的隶属关系 传统集合论中,一个元素的隶属函数X(x)0,1。而粗糙集理论中,X(x)0,1 定义定义4 4 设XU且xU,集合X的粗糙隶属函数粗糙隶属函数(rough membership function)定义为)()()(xR
25、cardxRXcardxRX 其中R是不分明关系,R(x)=xR=y:(yU)(yRx)(xRX=1当且仅当xRX)(xRX0当且仅当xRX)(xRX=0当且仅当xRX=2022-8-6高级人工智能 史忠植29隶属关系隶属关系显然有显然有 0,10,1。我们可以看到,这里的隶属关系。我们可以看到,这里的隶属关系是根据已有的分类知识客观计算出来的,可以被解是根据已有的分类知识客观计算出来的,可以被解释为一种条件概率,能够从全域上的个体加以计算,释为一种条件概率,能够从全域上的个体加以计算,而不是主观给定的。而不是主观给定的。)(xRX2022-8-6高级人工智能 史忠植30集近似实例集近似实例
展开阅读全文