决策粗糙集理论研究现状与展望_于洪.pdf 12页

内容提供方：yaocen
大小：515.18 KB
字数：约14.34万字
发布时间：2017-10-24发布于湖北
浏览人气：1
下载次数：仅上传者可见
收藏次数：0
需要金币：*** 金币 (10金币=人民币1元)

决策粗糙集理论研究现状与展望_于洪.pdf

关闭预览

想预览更多内容，点击免费在线预览全文

免费在线预览全文

决策粗糙集理论研究现状与展望_于洪

第卷第期计算机学报３８８　　　　　　　　　Ｖｏｌ．３８Ｎｏ．８年月２０１５８Ａｕ．２０１５ＣＨＩＮＥＳＥＪＯＵＲＮＡＬＯＦＣＯＭＰＵＴＥＲＳｇ　　　　决策粗糙集理论研究现状与展望），）），））于洪１３王国胤１２姚一豫３　　　）１（）重庆邮电大学计算智能重庆市重点实验室重庆４０００６５　　）２（）中国科学院重庆绿色智能技术研究院电子信息技术研究所重庆４００７１４　　）３（）里贾纳大学计算机科学系里贾纳Ｓ４Ｓ０Ａ２加拿大　　、摘要经典粗糙集理论中的核心概念上下近似集是通过集合相交非空和包含来定义的由于缺乏对错Ｐａｗｌａｋ．　　，，误的容忍能力其实际应用受到了限制世纪年代初等人结合贝叶斯决策理论提出了决策粗糙集模型．２０９０Ｙａｏ．，，近年来该模型逐渐得到重视并在不确定性信息处理方面得到了广泛应用该文首先就为什么要提出决策粗糙集．、，模型该模型具有什么特点以及该模型中需要解决的几个问题进行了详细讨论然后总结了国内外关于决策粗糙．，，集模型的研究现状和进展详细分析了存在的挑战性问题并深入探讨了未来的研究方向．；；；；；关键词粗糙集决策粗糙集三支决策数据分析不确定性智能信息处理　中图法分类号号／ＴＰ１８ＤＯＩ１０．１１８９７ＳＰ．Ｊ．１０１６．２０１５．０１６２８　　　ＣｕｒｒｅｎｔＲｅｓｅａｒｃｈａｎｄＦｕｔｕｒｅＰｅｒｓｅｃｔｉｖｅｓｏｎＤｅｃｉｓｉｏｎＴｈｅｏｒｅｔｉｃＲｏｕｈＳｅｔｓ　　　　　　－　　ｐｇ），）），））１３１２３ＹＵＨｏｎＷＡＮＧＧｕｏＹｉｎＹＡＯＹｉＹｕ　ｇ　　－　　－）１（，，）ＣｈｏｎｉｎＫｅＬａｂｏｒａｔｏｒｏＣｏｍｕｔａｔｉｏｎａｌＩｎｔｅｌｌｉｅｎｃｅＣｈｏｎｉｎＵｎｉｖｅｒｓｉｔｏＰｏｓｔｓａｎｄＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓＣｈｏｎｉｎ４０００６５　　　　ｇｑｇｙｙｆｐｇｇｑｇｙｆｇｑｇ　　　　　　　）２（，，ＩｎｓｔｉｔｕｔｅｏＥｌｅｃｔｒｏｎｉｃＩｎｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏＣｈｏｎｉｎＩｎｓｔｉｔｕｔｅｏＧｒｅｅｎａｎｄＩｎｔｅｌｌｉｅｎｔＴｅｃｈｎｏｌｏ　ｆ　ｆ　ｇｙｇｑｇ　ｆ　　ｇ　ｇｙ　　　，）ＣｈｉｎｅｓｅＡｃａｄｅｍｏＳｃｉｅｎｃｅｓＣｈｏｎｉｎ４００７１４　　ｙｆｇｑｇ　　）３（，，，，）ＤｅａｒｔｍｅｎｔｏＣｏｍｕｔｅｒＳｃｉｅｎｃｅＵｎｉｖｅｒｓｉｔｏＲｅｉｎａＲｅｉｎａＳａｓｋａｔｃｈｅｗａｎＳ４Ｓ０Ａ２Ｃａｎａｄａｐ　ｆｐ　ｙｆｇｇ　　　　ＡｂｓｔｒａｃｔＡｓｔｈｅｃｅｎｔｒａｌｃｏｎｃｅｔｓｉｎｒｏｕｈｓｅｔｔｈｅｏｒ，ｔｈｅｃｌａｓｓｉｃａｌＰａｗｌａｋｌｏｗｅｒａｎｄｕｅｒ　　　　　　　　　　　　　ｐｇｙｐｐａｒｏｘｉｍａｔｉｏｎｓａｒｅｄｅｆｉｎｅｄｂａｓｅｄｏｎｕａｌｉｔａｔｉｖｅｓｅｔｉｎｃｌｕｓｉｏｎａｎｄｎｏｎｅｍｔｏｖｅｒｌａｉｎｐｐ　　　　　ｑ　－　　－ｐｙｐｐｇ　，，，ｒｅｌａｔｉｏｎｓｒｅｓｅｃｔｉｖｅｌ．Ｃｏｎｓｅｕｅｎｔｌｔｈｅｔｈｅｏｒｓｕｆｆｅｒｓｆｒｏｍａｎｉｎｔｏｌｅｒａｎｃｅｏｆｅｒｒｏｒｓｗｈｉｃｈｐｙｑｙ　ｙ　　　　　　，ｒｅａｔｌｒｅｓｔｒｉｃｔｓｉｔｓｒｅａｌｗｏｒｌｄａｌｉｃａｔｉｏｎｓ．ＴｏｏｖｅｒｃｏｍｅｔｈｉｓｌｉｍｉｔａｔｉｏｎＹａｏａｎｄｃｏｌｌｅａｕｅｓｒｏｏｓｅｄ　　－　　　　　　　ｇｙｐｐｇｐｐ　（） ’ ａｄｅｃｉｓｉｏｎｔｈｅｏｒｅｔｉｃｒｏｕｈｓｅｔｓＤＴＲＳｍｏｄｅｌｉｎｅａｒｌ１９９０ｓｂｉｎｔｒｏｄｕｃｉｎｔｈｅＢａｅｓｉａｎ　－　　　　　ｇｙｙｇｙ　　　，ｄｅｃｉｓｉｏｎｔｈｅｏｒｉｎｔｏｒｏｕｈｓｅｔｓ．Ｉｎｒｅｃｅｎｔｅａｒｓｔｈｅｍｏｄｅｌｈａｓａｔｔｒａｃｔｅｄｍｕｃｈａｔｔｅｎｔｉｏｎａｎｄｈａｓ　　　　　　　　　　　　ｙｇｙ　（）ｂｅｅｎａｌｉｅｄｉｎｕｎｃｅｒｔａｉｎｉｎｆｏｒｍａｔｉｏｎｒｏｃｅｓｓｉｎ．Ｔｈｉｓａｅｒａｉｍｓａｔ１ｒｅｓｅｎｔｉｎａｓｕｒｖｅｏｆ　　　　　　　　　ｐｐｐｇｐｐｐｇｙ　　，，ｍｏｔｉｖａｔｉｏｎｓｆｏｒｉｎｔｒｏｄｕｃｉｎｔｈｅＤＴＲＳｍｏｄｅｌｔｈｅｍａｉｎｆｅａｔｕｒｅｓｏｆｔｈｅｍｏｄｅｌａｎｄｔｈｅｔｈｅｒｏｂｌｅｍｓ　　　ｇ　　　　　　　　　ｐ　，（），，ｔｏｂｅｓｔｕｄｉｅｄｉｎｔｈｅｍｏｄｅｌ２ｒｅｖｉｅｗｉｎｔｈｅｆｕｎｄａｍｅｎｔａｌｒｅｓｕｌｔｓｓｔａｔｅｏｆａｒｔｒｅｓｅａｒｃｈａｎｄ　　　　　ｇ　　－－　　，（）ｃｈａｌｌｅｎｅｓａｎｄ３ｏｉｎｔｉｎｏｕｔｆｕｔｕｒｅｅｒｓｅｃｔｉｖｅｓａｎｄｏｔｅｎｔｉａｌｒｅｓｅａｒｃｈｔｏｉｃｓ．　　　　　　ｇｐｇｐｐｐｐ　；；；；；Ｋｅｗｏｒｄｓｒｏｕｈｓｅｔｓｄｅｃｉｓｉｏｎｔｈｅｏｒｅｔｉｃｒｏｕｈｓｅｔｓｔｈｒｅｅｗａｄｅｃｉｓｉｏｎｓｄａｔａａｎａｌｓｉｓｕｎｃｅｒｔａｉｎ　　－　　－　ｙｇｇｙｙ　ｉｎｔｅｌｌｉｅｎｔｉｎｆｏｒｍａｔｉｏｎｒｏｃｅｓｓｉｎ　　ｇｐｇ［］１论是于年提出的一种处理不精确、Ｐａｗｌａｋ１９８２、引言不一致不完整信息与知识的数学工具粗糙集理论１．　　，、作为一种数据分析处理理论在机器学习知识发（，、）粗糙集也称集粗集理、、、、、ＲｏｕｈＳｅｔｓＲｏｕｈ现数据挖掘决策支持与分析信息安全物联网ｇ　ｇ：；：（，）、收稿日期最终修改稿收到日期本课题得到国家自然科学基金重庆市自然科学基金重６１２７２０６０－－－－（），，，，，（），、、点项目资助于洪女年生博士教授中国计算机学会会员主要研究领域为三支决策三支聚类粗ｃｓｔｃ２０１３Ｂ４０００３．１９７２ＣＣＦ　ｊｊ、、：，，，，，糙集区间集智能信息处理和智能和数据挖掘等王国胤男年生博士教授中国计算机Ｗｅｂ．Ｅｍａｉｌｕｈｏｎｃｕｔ．ｅｄｕ．ｃｎ．１９７０－＠ｙｇｑｐ（），、、、、：，，学会会员主要研究领域为粗糙集粒计算机器学习数据挖掘知识技术和认知计算等姚一豫男ＣＣＦ．Ｅｍａｉｌｗａｎｉｅｅｅ．ｏｒ．－＠ｇｇｙｇ，，，、、、、、年生博士教授主要研究领域为三支决策粗糙集区间集粒计算信息检索智能和数据挖掘等１９６２Ｗｅｂ．：８期于洪等决策粗糙集理论研究现状与展望１６２９　、，云计算生物信息处理等领域得到了广泛且成功地糙集的一些基本知识并给出了概率粗糙集模型理［］２１１－应用，，．论研究的个基本问题然后围绕这些基本问题３．粗糙集的基本思想是用可定义集合来刻画不可，解释了决策粗糙集模型的贡献并综述了该模型在，定义集合从而给出一个概念的上近似集和下近似，这些问题上的已有解决方案最后介绍国内外决策．集定义经典粗糙集的近似是基于概念之间的定性，．粗糙集模型的研究与应用现状以及需要重点研究（），关系即包含或相交不空定义的并不考虑概念相的主要问题我们将这个理论模型目前的研究状况．，交的程度因而不适用于处理很多实际问题为了解．，介绍给信息科学工作者希望进一步推动并促进该、决Ｐａｗｌａｋ粗糙集模型过于严格缺乏容错能力的领域的研究工作．，问题人们提出了各种概率型粗糙集扩展模型．［］１２年，等人提出了决策粗糙集模型１９９０Ｙａｏ２经典Ｐａｗｌａｋ粗糙集模型　（，），ＤｅｃｉｓｉｏｎＴｈｅｏｒｅｔｉｃＲｏｕｈＳｅｔｓＤＴＲＳ拓广了－　ｇ　［］１３等人的概率粗糙集模型决策粗糙Ｐａｗｌａｋ０．５．－粗糙集主要研究的问题是集合的近似及相关的集模型的主要出发点是用条件概率定义概念的相交［，］数据分析和推理方法与算法１３１粗糙集理论的重．，，程度并用两个阈值定义概率上下近似集．１９９３年要贡献是给出了一种基于等价关系的数据分析方［］１４提出了变精度粗糙集模型（ＺｉａｒｋｏＶａｒｉａｂｌｅＰｒｅｃｉ　－，、法并给出了一个非常精确严格的数学描述粗糙．，），ｓｉｏｎＲｏｕｈＳｅｔｓＶＰＲＳ从集合包含度的视角给出　ｇ　、集理论首次形式化地描述了对象不可分辨性属性（了决策粗糙集模型的一个特例即两个阈值之和为冗余性及属性约简等重要概念．）随后，和相继提出了粗糙隶属１．ＰａｗｌａｋＳｋｏｗｒｏｎ，作为一种数据分析方法粗糙集主要以数据表［］［］１５１６１７－、；，函数概念参数化粗糙集模型２００５年，为工具研究属性之间的依赖关系从而获得有用的［］１８＇提出了贝叶斯粗糙集模型（ｌｚａｋＢａｅｓｉａｎＲｏｕｈＳ  ｙ　ｇ分类知识一个数据表定义为一个有穷对象集和属．［］，）；年，和１９提出了博弈ＳｅｔｓＢＲＳ２００８ＨｅｒｂｅｒｔＹａｏ，（，）性集的二元组即一个属性子集定义Ｓ＝ＵＡｔ．粗糙集模型（，）ＧａｍｅＴｈｅｏｒｅｔｉｃＲｏｕｈＳｅｔｓＧＴＲＳ．－　ｇ　，，一个对象集上的等价关系记为其等价类是基本Ｅ，这些工作增进了对粗糙集理论的研究并且扩大了，的可定义子集通过等价类我们可以描述或近似描．［］２０２９粗糙集理论的应用领域－．述的任何一个子集设子集表示一个概念Ｕ．ＸＵ，现实世界中更多的是不确定性信息如何从这，，所包含的对象集即该概念的外延它不一定可以准、、些不精确不一致不完整的信息中得到我们需要的，确地用的等价类来描述也就是说不一定是一ＥＸ［］３０，知识是广大学者一直关注的问题决策粗糙集．，组等价类的并集因此用一对上近似和下近似来刻．，模型结合概率论展开研究给出了粗糙集理论的定画Ｘ：，，量描述以及基于贝叶斯决策论的一个语义模型（）｛［］｝，ａｒＸ＝ｘＵ｜ｘＸ  ｐ ∈ ∩ ≠ 、同时也给出了一个实际有效的解释和计算阈值（）｛［］｝（）ａｒＸ＝ｘＵ｜ｘＸ１ｐ ∈  ，的方法为我们研究不确定知识提供了一个新的，、　　给定任何一个子集ＸＵ基于它的上下近，思路近年来在国内外粗糙集学术会议和有关期．，：似得到的一个划分Ｕ［，］６８１０刊上关于决策粗糙集的研究成果日渐增多－．（）（）｛［］）｝，ＰＯＳＸ＝ａｒＸ＝ｘＵｘＸｐ ∈ ｜  ，（）、例如国际认知信息学系列会议在年ＩＣＣＩ２０１０（）（）｛［］｝，ＮＥＧＸ＝Ｕ－ａｒＸ＝ｘＵｘＸ＝ｐ ∈ ｜ ∩  （）国际粗糙集与知识技术系列会议ＲＳＫＴ自２００９（）（）（）ＢＮＤＸ＝ａｒＸ－ａｒＸ年以来都成功举办了以决策粗糙集为主题的专题讨ｐｐ｛［］（［］）｝（）＝ｘＵｘＸｘＸ２；、　　　 ∈ ｜ ∩ ≠∧  论中国集与软计算智能及粒计算联ＲｏｕｈＷｅｂｇ（）、这个子集分别称为的正域负域（），　　３ＸＰＯＳＸ合学术会议自年以来每ＣＲＳＳＣＣＷＩＣＧｒＣ２０１０－－（）（）年都举办了以决策粗糙集为主题的分组讨论此外，ＮＥＧＸ和边界域ＢＮＤＸ．．、，《》上近似下近似从定性的角度考虑了两种情况ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＡｒｏｘｉｍａｔｅＲｅａｓｏｎｉｎ　　　ｐｐ　ｇ《》即可能性和必然性上近似解释为如果存在一个与ＦｕｎｄａｍｅｎｔａＩｎｆｏｒｍａｔｉｃａｅ等国际学术期刊出版．ｘ　，了以决策粗糙集为主题的专辑决策粗糙集正在成的等价对象在集合中那么这个对象可能属于Ｘ．；为当前的研究热点下近似解释为如果一个对象的所有等价对象Ｘｘ．，本文首先简要介绍了粗糙集和决策粗都在集合中那么它必然属于ＰａｗｌａｋＸＸ．计算机学报年１６３０２０１５　　　　　　　　（）；１阈值和的解释与计算 α β （）（［］）；概率粗糙集模型２条件概率ＰｒＸｘ的估计３｜　（）、３概率正负及边界域的解释与应用．，Ｐａｗｌａｋ粗糙集可以被视为一种定性的近似下决策粗糙集模型的研究贡献在于它不仅给出了近似由集合包含定义而上近似由集合相交非空定、，概率正负和边界域这个结果更重要的是给出了解，，：义该定义不允许任何不确定性这种优点同时也带决这个问题的合理方案比如基于贝叶斯决策论．３来它的局限性．可以通过决策风险最小化获得阈值的计算和解［］［］１２３５，；；在Ｐａｗｌａｋ粗糙集中由于正域是建立在代数释通过朴素贝叶斯模型估计条件概率概率［］３６３７－，包含关系基础上的因此难以体现概念表示的容错个区域可以看做是三支决策理论的应用因３．，性这正是经典粗糙集模型的局限所在针对，．Ｐａｗｌａｋ此决策粗糙集是一个有坚实理论基础同时又实用［］３８４０－，粗糙集模型缺乏容错能力的问题我们需要考虑的模型．，Ｐａｗｌａｋ粗糙集的另一种表示即将概率近似空间引，入到粗糙集的研究中获得定量粗糙集模型．决策粗糙集理论研究的个问题４３　［］３２３３和－于年将概率近似空ＷｏｎＺｉａｒｋｏ１９８７ｇ（［］），间引入到粗糙集的研究中令表示任何在本节中我们将围绕上一节的个问题介绍．ＰｒＸ｜ｘ３一个对象在属于［］的条件下属于的条件概率决策粗糙集的已有研究结果ｘＸ．．，：那么可以获得下面的等价条件４．１阈值的解释与计算　（［］）［］，、，、ＰｒＸｘ＝１ｘＸ与Ｐａｗｌａｋ正负域不同概率正负域包含错误｜   （［］）［］，分类正域的错误分类率是（［］），ＰｒＸｘ＝０ｘＸ＝．１－ＰｒＸｘ１－｜  ∩  ｜  α （［］）［］（［］）负域的错误分类率是（［］）这为和０ＰｒＸｘ１ｘＸｘＸ．ＰｒＸ｜ｘ  ． α ＜｜＜  ∩ ≠∧  β β ，：给出了一种基于错误分类率的解释该解释有其直这样就得到了Ｐａｗｌａｋ三个域的另一种表示．（）｛（［］）｝，，观易懂的优点但是这并没有给出一种指导思想和ＰＯＳＸ＝ｘＵＰｒＸｘ＝１． ∈ ｜｜　（）｛（［］）｝，一套有效的方法来解释和获得这两个阈值．ＮＥＧＸ＝ｘＵＰｒＸｘ＝０ ∈ ｜｜［］３３（）｛（［］）｝（）在年的科技报告中，和提ＢＮＤＸ＝ｘＵ０ＰｒＸｘ１３１９８５ＷｏｎＺｉａｒｋｏ ∈ ｜＜｜＜ｇ，，显然定性粗糙集中的个域仅仅使用了概率的两出了０．５概率粗糙集模型该模型随后在Ｐａｗｌａｋ３－［］１３，个极端值即和这种表示为定量粗糙集给出了等人的文章中有更进一步的介绍这个模型的主０１．．一个很好的启示如果我们将和用其他的值来要理论依据是多数规则（）它用一个．０１ｍａｏｒｉｔｒｕｌｅ．ｊｙ　，、：表示那么就可以获得一种定量粗糙集模型概率阈值来定义概率正负和边界域．０．５［］，１２（）｛（［］）｝，在年等人提出了决策粗糙集模型ＰＯＳＸ＝ｘＵＰｒＸｘ０．５１９９０Ｙａｏ０．５ ∈ ｜｜＞（，）（）｛（［］）｝，ＤｅｃｉｓｉｏｎｔｈｅｏｒｅｔｉｃＲｏｕｈＳｅｔｓＭｏｄｅｌＤＴＲＳＭｏｄｅｌ．ＮＥＧＸ＝ｘＵＰｒＸｘ０．５－　　　　ｇ０．５ ∈ ｜｜＜该模型用一对概率阈值来替换上面所提到的和（）｛（［］）｝（）０ＢＮＤＸ＝ｘＵ０ＰｒＸｘ＝０．５５０．５ ∈ ｜＜｜，（，）、设则概率正负和边界域可，［］１．０１阈值定量地刻画了多数规则当等价类中  ＜α α －０．５ｘ β β 定义如下：，超过一半的元素属于时我们可以将放到ＸｘＸ（）｛（［］）｝，；，（，）的正域中当超过一半的元素不属于时我们可ＰＯＳＸ＝ｘＵＰｒＸｘＸ αβ ∈ ｜｜ α （）｛（［］）｝，；以将放到的负域中当刚好一半的元素属于（，）ｘＸＸＮＥＧＸ＝ｘＵＰｒＸｘ αβ ∈ ｜｜ β ，（）｛（［］）｝（）时我们可以将放到的边界域中但这种多数（，）ｘＸ．ＢＮＤＸ＝ｘＵＰｒＸｘ４ αβ ∈ ｜＜｜＜α β （，）（，）（，），规则并不能解释一般的阈值当阈值 αβ 取值为１０时我们就获得了Ｐａｗｌａｋ αβ ．（，），，，（，）、关于一般的阈值的确定决策粗糙集简单粗糙集因此从形式上看正负和边界域拓 α ． αβ － β ［］１２，地使用了贝叶斯决策理论对于一个子集，广了粗糙集对于构建新的模型来讲这还．ＸＵＰａｗｌａｋ．  ｛，ｃ｝，ｃ，可以构造一个状态集合其中和远远不够我们需要探讨和解释该模型所用到的基 Ω＝ＸＸＸＸ、互补本概念基本量和语义解释．．，、，关于概率粗糙集模型至少有以下个问题需对应于粗糙集中的正域边界域和负域我们就３［］要解决３４：可以构造一个决策动作集｛，，｝，Ａｃｔｉｏｎ＝ａａａＰＢＮ：８期于洪等决策粗糙集理论研究现状与展望１６３１　其中，，和分别代表将一个对象分类到正域、损耗应该小于或等于将其划分到边界域（）ａａａＢＮＤＸＰＢＮ，（），；，边界域和负域的决策动作即ｘ∈ ＰＯＳＸｘ∈ 的损耗而且这两种损耗应该小于将这个对象划分（），（）（）：，不同的决策动作会导致不到正域的损耗即有关系ＢＮＤＸｘＮＥＧＸ．ＰＯＳＸ． ∈ λ λ ＜λ ＰＰＢＰＮＰ，，，（）（）同的分类后果可能的种损失函数见表其中基于这两个条件从规则６１． λ λ ＜λ ．Ｐ～ＮＮＮＢＮＰＮ，可以获得以下个阈值：第列函数表示一个对象属于集合时采取动作３１Ｘ，，；（）和带来的损失函数记为和第－ａａａ λ λ λ λ λ ＰＮＢＮＰＢＮＰＰＢＰＮＰ，＝ α （）（） λ －λ ＋ λ －λ ＰＮＢＮＢＰＰＰ，列函数表示一个对象不属于集合时采取动作２Ｘ（－） λ λ ＰＮＮＮ，和带来的损失函数记为，和ａａａ．， λ λ λ ＰＢＮＰＮＢＮＮＮ＝ γ

下载文档
收藏
分享赏
0

您可能关注的文档

文档评论（0）

内容提供方：yaocen
审核时间：2017-10-24
审核编号：5123311201001121
认证类型：实名认证
能力类型：内容提供者
领域认证：
版权证书：
区块链号：

决策粗糙集理论研究现状与展望_于洪.pdf 12页