一种新的粗糙集约简定义及其模糊扩展研究

一种新的粗糙集约简定义及其模糊扩展研究

赵士欣[1]2004年在《一种新的粗糙集约简定义及其模糊扩展研究》文中研究指明在粗糙集理论的代数观点下,约简关注的只有数据库中相容示例的部分;而在粗糙集理论的信息论观点下,约简开始关注库中不相容的部分,试图保证数据库中所有数据的不可分辨关系不发生变化。但是我们验证了它的不完全性,并给出一种新的约简的定义。这样定义的约简完全体现了原数据库中所有数据的不可分辨关系,弥补了信息论的这一不足。通过对约简算法的研究,提出了一种不一致度增加函数启发的属性约简算法,并从理论与实验两方面验证了它的正确性及有效性。将建立在分明集上的一些概念及相应结沦推广到模糊集上是一项很有意义的工作。本文将粗糙集理论的核心概念——约简与核,推广到了模糊集上,定义了——模糊约简与模糊核,这种扩展研究有希望导致一种新的Rough—fuzzy理论。

郑桂玲[2]2007年在《基于变精度容差关系的扩展粗糙集及其在数据挖掘中的应用研究》文中研究表明粗糙集理论是由Pawlak教授于20世纪80年代初提出的一种用于处理不确定性和模糊知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它适合于发现数据中隐含的、潜在的、有用的规律,即知识,找出其内部数据的关联关系和特征,而无需提供相关数据集合外的任何先验信息,使问题处理更客观、更符合实际。近年来,粗糙集理论和应用取得了很大的成功,已成为软计算方法的重要分支,其涉及的领域包括模式识别、机器学习、决策分析和决策支持、知识获取、知识发现等。但对不完备决策信息系统问题的处理还不甚完善,论文对此进行了专门的研究,提出了一些解决方法。首先介绍了粗糙集的基本理论及其在不完备不协调信息系统下的扩展模型,在指出它们的局限性后,提出了一种基于变精度容差关系的扩展粗糙集模型,该模型将一定的统计信息和人的心理因素结合起来以划分分辨类,并进一步定义了上、下近似集和属性的重要性。然后考虑了求约简的问题,已经有证明显示求得所有约简和最小约简是NP-Hard问题,目前出现了很多启发式算法,但利用分辨矩阵是主流。论文提出了一种新的分辨矩阵的求法,克服了基于容差关系得到的分辨矩阵核属性过多和其它非空元素包含分辨属性过少的缺陷。在此基础上,又给出了一种新的求约简集的算法,此算法计算复杂度比已有的基于分辨矩阵求约简的计算复杂度明显降低。得到约简集后,接下来进行了规则提取工作,建立了知识树,研究了知识树的剪枝条件,给出了规则提取算法,不仅降低了计算复杂度,而且还减少了冗余规则。并且论文每一个模型或算法都用matlab进行了程序实现,其后还给出了算例分析,以此验证这些模型及算法的有效性。论文的最后对基于变精度容差关系扩展粗糙集在保险公司客户流失及汽车里程决定因素分析中的实际应用进行了探讨。

胡正耀[3]2012年在《基于粗糙集理论的数据约简研究与应用》文中指出粗糙集理论作为一种处理模糊和不确定性知识的数学工具,在数据约简方面有着广泛的应用与研究,针对传统的粗糙集理论不支持对不完备决策表的约简这个问题,扩展的粗糙集理论相继被提出,在传统粗糙集的等价关系基础上发展出了相似、容差关系、限制容差关系等,当前基于粗糙集理论的约简算法,例如可辨识矩阵以及属性重要度等,都是基于数据的约简却忽略的数据之间的关系,同时在对大规模复杂数据集进行约简时,由于理论上得到最小约简是一个NP难度问题,使得约简的效率急剧下降,从而导致约简算法的不适用和不可操作性。在分析了现有粗糙集理论约简算法的基础上,本文针对当前粗糙集约简主要面临的一些问题,提出了一种聚类反馈约简算法模型。对传统约简算法中忽略数据关系而进行约简的问题提出了一种数据关系聚类算法,通过对关联点的提取来描述数据之间的关系,通过与云模型理论结合,将模糊粗糙性与随机性进行互补,利用云模型来进行数据集的划分,结合粒计算的思想将整个算法模型设计成一个可并行运行的算法,同时通过建立虚拟节点构建聚类粒度树,以邻近传播为策略,以反馈修正为导向,使得算法是一个满足增量式的约简的要求。在构建虚拟节点时,通过隶属度分类规则的调整,以提高整体的约简效率。并在数据点、关联点的提取时引入了数据集成映射的概念,以解决不同平台数据规格的不统一问题。本文基于数据关系的聚类反馈约简算法模型在总结前人研究的基础上借鉴了多种算法模型的特点,同时运用分层的思想,对约简过程进行了一定的改进。经过模拟实验,证明该算法模型是可行的、有效的。

王加阳[4]2005年在《面向海量数据的粗糙集理论与方法研究》文中进行了进一步梳理粗糙集理论自提出以来,其理论与方法不断得到发展,在许多方面克服了传统数据分析理论显现出的诸多不足,表现出其独特的优势,受到了国内外学术界的广泛关注。本文面向海量数据从多个层面对粗糙集理论进行了学术探讨,评述了国内外研究进展,深入研究了基于粗糙集的约简,可变精度粗糙集模型,动态约简,规则集决策分析,多知识库决策融合等方面的问题。 (1) 基于归并的约简分析,描述了归并为属性约简的最本质特征,给出了约简的细分层次关系,体现为偏序格结构,从实质上把握了一个决策信息系统的约简特征。根据分类特性,探讨了信息熵、决策熵和条件熵的思想,给出了它们的性质,以及相互之间的关系,分析了他们对决策信息系统不确定性和约简的影响。对时序决策信息系统,重点研究了时序信息系统的获取及约简等基本问题,提出了时间重要性约简策略。 (2) 深入分析了可变精度粗糙集模型的约简异常,通过引入条件类包含度阀值的概念,描述了包含度与分类率的区间关系,分析了包含度区间的动态变化和正区域变化引起的约简异常,提出了消除异常的区间约简基本思想,并构造了区间约简算法,完善了可变精度粗糙集模型约简。 (3) 阐述了动态约简基本思想,进一步描述了多层次的形式化动态约简模型,提出了F族计算的新方法,把约简精度系数引入到对抽样的估计中,并进行了深入细致的特性分析,获得了良好的结果。提出了动态核概念,研究了动态核的多层次形式化定义,探讨了动态核具有的基本性质,论证了动态约简交集对动态核的包含性,该思想对各层面的动态约简形式化定义都具有一致的适应性,从而说明动态核真正具备了属性核的本质特征。 (4) 研究了决策规则的多种度量,分析了度量体现的性质,提出了规则集合的决策度量,从整体上体现了一个规则集合的性能,为多知识库模型选择奠定了基础。针对目前值约简方法的不足,提出了基于规则分辨矩阵的值约简思想,从整体上体现了一个规则集的性质,完整地阐述了值约简,为决策分析奠定了基础。 (5) 基于模型集成的基本理论,给出了模型的形式化表示,提出了模型组合关系与模型集成方法,把规则知识库作为一个单元决策模

孔芝[5]2008年在《粗糙集理论若干问题的研究与应用》文中认为粗糙集理论是处理不精确、不确定和不完整的一种新的数学工具。本文介绍了粗糙集的基本概念和研究现状,在此基础上研究粗糙集的两个因子、不确定测量方法、属性约简和属性细化以及粗糙集方法在软集合参数约简中的应用问题。具体内容介绍如下:(1)针对原确定增量算子与不确定减量算子表达式没有清晰表达这两个算子真实含义的问题,重新定义该算子,并从理论上证明两类算子定义方式是等价的。在此基础上提出多集合确定增量算子与不确定减量算子定义,并研究两类多集合算子的性质。(2)提出一般关系下的信息熵和条件熵的概念,并从理论上证明一般关系下的信息熵是等价关系与相容关系下的信息熵的扩展,且一般关系下的条件熵是等价关系下的条件熵各项分量的加权和。其次提出粗覆盖下的条件熵与互信息熵的概念,并研究了它们的性质。(3)对已有和声搜索算法的两个重要调节参数进行改进,利用每次迭代目标函数值的最大差值来调节这两个参数,提出自适应和声搜索算法,为验证算法的有效性,利用五个标准测试函数且与其它叁种优化算法作比较,仿真结果表明自适应和声搜索算法具有跳出局部极小值的能力和较强的鲁棒性。最后把该算法应用到粗糙集属性约简中,利用属性重要度作为属性约简的启发式信息,得到比较好的结果。(4)把粗糙集不可分辨关系引入到软集合中,提出软集合正则参数约简的定义,并利用软集合参数重要度得到正则参数约简的必要条件,且给出正则参数约简算法。在此基础上研究模糊软集合正则参数约简问题。最后研究模糊软集合方法在决策问题上的应用,举例说明目前已有方法的不足,并对已有方法进行修正。(5)提出了有效等价细化和有效集合细化的概念,研究条件属性细化程度与上近似、下近似、近似分类精度、近似分类质量、规则数目、相对约简和属性必要性的关系。

王莉[6]2013年在《基于粗糙—模糊集成的分类知识发现》文中指出从数据中抽象分类模型是是知识发现的重要研究内容,而实际数据所蕴涵的不确定性、不一致性和随机性是分类知识发现面临的主要困难。粗糙集和模糊集都可以处理不确定性和不精确性问题,但是两者的侧重点不同。粗糙集研究的是不同类的集合对象之间的不可分辨性,而模糊集研究的是类与类边界的重迭性。模糊集的隶属函数大多是专家凭经验给出,而粗糙集不需要数据之外的任何先验信息。粗糙集和模糊集在处理不确定性问题上各有所长,将两者有机结合可以更好地处理实际问题。本文将连续数据作为研究对象,以分类知识发现为目的,对粗糙集和模糊集的集成方法展开了一系列研究。主要内容如下:1.根据模糊分类模型在处理分类问题上的优势,结合决策粗糙集在处理不一致性和随机性数据中的优点,提出了一种新的模糊分类模型构造方法。先对决策粗糙集模型的性质进行研究分析,在此基础之上提出了属性约简的概念及相应的算法。首先采用模糊c均值聚类算法对连续属性值离散化同时对输入空间进行模糊划分;然后利用两步搜索策略计算离散化决策表的约简集,删除冗余的条件属性;从约简后的决策表中提取决策规则,再将决策规则转换成模糊分类规则,从而建立了模糊分类模型。该模糊分类模型直接基于对数据的分析,具有结构简单、语义解释性好和泛化能力强的优点,并且不需要再利用学习算法对参数进行调节。2.指出Lingras粗k均值聚类算法的一些缺点,讨论分析了这些缺点的产生原因,在此基础上提出了一种改进的粗k均值聚类算法。改进的算法通过定义潜能来确定初始的聚类中心,并将Lingras粗k均值聚类算法计算上下近似所用的绝对距离改为相对距离。改进的算法初始聚类中心位置设置合理,对类边界的划分更加恰当,聚类效果好,性能稳定。基于改进粗k均值聚类算法,提出了一种新的模糊分类模型。采用改进粗k均值聚类算法对输入空间进行聚类从而构建初始的模糊分类系统,再利用遗传算法对初始模糊分类模型的前件参数进行优化,从而得到最终的模糊分类模型。该模糊分类模型实现了参数的准确辨识,具有较高的精度和泛化能力。3.针对决策粗糙集只能处理离散数据的局限性,提出了能够直接用于连续数据的模糊决策粗糙集模型。将决策粗糙集模型严格不可分辨关系放松至模糊T-等价关系,从模糊隶属度角度定义条件概率,构造新的概率包含关系,在此基础上建立了模糊决策粗糙集模型。还研究了模糊决策粗糙集模型的性质,并提出了模糊决策粗糙集模型属性约简的定义及相应的约简算法。为进一步研究模糊决策粗糙集在分类建模中的应用提供了理论基础。4.基于前面提出的模糊决策粗糙集模型,设计了一种基于约简的选择性多分类器集成系统。基于模糊决策粗糙集模型,利用两步随机属性约简算法,计算得到原始数据的多个不同约简。在每组约简上训练一组个体分类器,再利用遗传算法从每组个体分类器中选择部分按照相对多数投票法进行集成。该多分类器集成系统利用了不同约简所提供的互补信息,个体分类器之间的差异较大。实验研究的结果表明本文提出的多分类器集成系统具有较好的分类能力,且被集成的个体分类器数目较少。

滕书华[7]2010年在《基于粗糙集理论的不确定性度量和属性约简方法研究》文中研究说明随着数据获取手段的快速发展,数据库数量和规模的增长速度远远超出了人类分析和应用的能力。如何从杂乱无章的、强干扰的海量数据中挖掘出潜在的、新颖的、正确的、有利用价值的知识,来改变“数据丰富,知识贫乏”这种局面,已成为智能信息处理领域研究的一个重要课题。粗糙集理论作为一种新的知识发现方法,在很多领域获得了广泛的应用,其中属性约简是其最重要的应用之一。经过近30年的发展,基于粗糙集的属性约简理论和方法得到了迅速的发展和完善,但也存在着一些问题。如,不确定性度量在属性约简中有着重要的应用,而现有度量方法并不能精确描述集合的不确定性,故探讨更加合理的度量方法是一个基础性问题;此外,缺乏普遍适用的高效约简算法,这是制约粗糙集理论实用化的重要方面。据此,本文对粗糙集理论的不确定性度量和属性约简两方面进行了系统研究,主要工作及创新如下:(1)从知识区分能力角度在一般二元关系下提出了多种知识不确定性度量,通过直观的文氏图表示给出了新的不确定性度量明确的粗糙集理论含义,从而使得粗糙集理论中的不确定性度量的本质易于理解,丰富了粗糙集理论的内涵,并为后续的属性约简算法打下了理论基础。(2)考虑到数据对象具有不同重要性的情况,基于一般二元关系提出了新的知识加权不确定性度量—α熵、α条件熵和α互信息。通过调整参数α分析了现有多种不确定性度量的异同,进而将现有的多种不确定性度量统一在一般二元关系的粗糙集模型中。新的加权不确定性度量方便地融入了主观偏好、先验知识等因素,从而更加符合实际。(3)在一般二元关系下提出了一种适用性更广、更加有效的加权集成不确定性度量。理论分析和实例表明新的集成不确定性度量弥补了现有不确定性度量的缺陷,更符合人类的认知规律,更精确的反映了粗糙集的两种不确定性。(4)为了提高算法效率,把属性的区分能力作为启发函数,首先利用不可区分度在一般信息系统中提出了一种能够处理噪声的、高效的完备约简算法;其次,在决策信息系统中利用相对可区分度提出了一种高效的启发式约简算法,并给出了该算法与代数观点和信息观点下约简算法间的关系。通过对仿真数据和UCI数据集的实验结果表明,两种基于区分能力观点的约简算法不仅能有效的处理海量数据,而且在大多数情况下能够得到紧凑约简。(5)针对不协调决策系统,首先讨论了基于区分能力观点的约简定义和现有的不协调决策表多种约简定义之间的关系,给出了多种简化协调决策表的概念,进而提出了一种基于区分能力观点的高效不协调决策表约简算法。实验结果表明,新算法不仅可以求得现有多种方法的属性约简,而且具有较好的约简质量和较高约简效率,适合处理具有大量冗余属性的不协调数据集。(6)考虑到决策信息系统中的噪声,在一般二元关系下提出了两种能够抑制噪声的近似属性约简算法,即AAR-DV算法和AAR-WαA算法,两种算法适用于多种粗糙集扩展模型,摆脱了现有约简算法对特定二元关系的依赖。特别是AAR-WαA算法还将数据的先验知识引入到了约简算法中。实验表明两种近似约简算法可有效增强抗噪性,在有效降低约简属性集规模的同时,还提高了约简结果的分类性能。(7)考虑到进行分类时组合多个约简将产生互补信息,在一般二元关系下提出了一种基于加权α精度的多约简组合分类算法。通过对UCI数据的实验表明,多约简组合分类算法对于存在大量约简的数据集是可行的,在不增加算法时间复杂度基础上,不仅有效降低了特征数量,还大大提高了分类精度。综上所述,本文提出的不确定性度量和高效属性约简算法具有明确的粗糙集理论含义,简单易于理解,适用范围广,具有重要的理论意义和潜在的应用价值。

欧健[8]2004年在《汽轮发电机组振动故障集成诊断网络模型及方法研究》文中提出随着国民经济的发展,我国大型汽轮发电机组的单机容量日益增大,这对机组可用率、运行效率、安全性、可靠性与经济性提出了更高的要求。因此,研究汽轮发电机组振动故障诊断技术对其安全稳定运行有着十分重要的理论意义和巨大的经济效益。本文在总结和借鉴前人有关汽轮发电机组状态监测和故障诊断研究的基础上,重点研究了基于模糊集、人工神经网络、粗糙集、遗传算法以及它们相互结合机制的诊断理论和方法,用已有的汽轮发电机组振动故障实例进行了验证,得出了一些具有实用价值的结论,并提出了可靠、实用的大型汽轮发电机组振动故障诊断的新方法。本文主要内容有:1阐述了本课题研究的目的和意义,对汽轮发电机组振动故障的特点、机组在线监测和故障诊断技术的研究现状和方法以及模糊集、神经网络、粗糙集和遗传算法的发展及其在机组振动故障诊断中的应用进行了全面的综述。2分析和研究了汽轮发电机振动故障的电气、机械和热力机理,提出采用模糊集理论对征兆数据进行规范化处理的方法,为进一步的智能诊断技术研究奠定基础。3深入分析BP神经网络在理论和方法上存在的缺陷,提出采用遗传算法优化初始网络权重,将遗传算法与BP神经网络有机地结合起来,迅速得到BP神经网络最佳的初始权值矩阵,并成功地运用于汽轮发电机组振动故障诊断系统。4通过对粗糙集理论的深入分析,提出改善传统粗糙集约简抗干扰属性影响差的方法和基于遗传算法的粗糙集约简算法。仿真结果表明,该方法提高了粗糙集约简提取诊断规则的准确性和效率,能较好地满足诊断规则提取的技术要求,并成功地运用于汽轮发电机组振动故障诊断系统。5针对大型汽轮发电机组振动故障的复杂性、非线性、影响因素多等特点,首次提出基于粗糙集理论的诊断规则分层发现方法,在诊断实例中取得了较好的效果。6提出了基于粗糙集约简理论的汽轮发电机组振动故障诊断模糊神经网络,有效地压缩了神经网络的输入空间,经实例证明该方法能很好地对各层次的振动故障进行诊断。7综合本文的研究成果,将模糊集、神经网络、遗传算法和粗糙集结合起来,首次提出了结合多种智能方法的汽轮发电机组振动故障集成诊断网络,通过故障实例诊断分析,效果良好,具有较强的实用价值。

胡莹坚[9]2007年在《粗糙集理论及其在神经网络中的应用研究》文中认为粗糙集理论是一种较新的软计算方法,可以有效地分析和处理不完备信息,近年来日益受到国际学术界的重视,被成功地应用于人工智能、模式识别等诸多领域。本文主要对粗糙集中的基本问题——知识约简问题和连续属性离散化问题进行了研究,对粗糙集的扩展模型进行了探讨,并在此基础上提出了叁种不同领域中粗糙集与神经网络相结合的方式。本文系统地阐述了粗糙集的基本理论和概念,在这些基本理论的框架下,主要做了以下几个方面的研究:1.粗糙集理论的知识约简问题。本文首先对经典的属性约简的方法——基于区分矩阵的方法进行了分析。接着利用在理论说明中提出的信息熵的概念,从信息的角度,对决策表中属性的重要性给出度量;在此基础上,提出了一种基于信息熵的知识约简的启发式算法。2.粗糙集理论的连续属性离散化问题。本文对原有的贪心算法及其改进算法进行了分析,综合了前几种算法的优势,提出了利用互信息对信息系统决策表中断点的重要性给出度量;并融入断点核的概念来判断断点的重要性,提出了一种新的基于互信息的贪心算法改进方法,有效地解决了前几种算法的局限性。3.针对经典粗糙集理论在实际应用中的不足,介绍了常见的两种扩展模型:模糊粗糙集模型和变精度粗糙集模型。分别阐述其理论概念,研究了各模型的属性约简算法。4.研究了粗糙集与神经网络的结合方式。本文利用粗糙集在处理不精确性和不确定性问题上的优势,对数据样本进行预处理,约简样本属性,降低样本维数,得出近似值,获得最优约简后的决策规则,以此来映射到神经网络的训练样本中去,构建神经网络的隐层数及隐层内神经元数,使神经网络更富有逻辑性,并减少了神经网络的训练时间,提高训练精度及泛化能力。针对不同的实际应用类型,提出了不同的耦合方式以及训练算法,均取得了满意的效果。

黎文航[10]2007年在《基于变精度粗糙集理论的焊接动态过程知识建模方法研究》文中研究表明焊接自动化是焊接技术发展的一个趋势,由于焊接过程的高度复杂性,使得难以获得焊接过程的精确数学模型,从而限制了传统控制方法的应用。近年来,智能控制由于对复杂过程的适应性而得到重视,而在智能控制系统设计中,建模一般是必不可少且具有重要意义的。用模糊集方法、神经网络方法以及两者相结合的方法获取焊接过程的知识模型成为科研人员关注的焦点,但这些方法都存在一些本身难以克服的缺点。基于粗糙集(Rough Set, RS)的建模方法作为一种较新的方法已在焊接中得到应用,体现出较好的对焊接过程的适用性。但其应用水平还只是停留在经典RS集的程度上。为克服经典RS模型的一些不足,本文引入了变精度粗糙集理论(Variable Precision Rough Set,VPRS),提出了一种基于VPRS的知识建模方法。该方法考虑焊接过程和VPRS理论本身的特点,主要包含四个步骤:源数据的获取、数据的预处理、VPRS模型约简和知识推理。(1)源数据的获取这是VPRS建模方法的前提和基础。本文采用实验设计法来获取焊接过程的数据。以脉冲钨极氩弧焊(Gas Tungsten Arc Welding,GTAW)

参考文献:

[1]. 一种新的粗糙集约简定义及其模糊扩展研究[D]. 赵士欣. 河北大学. 2004

[2]. 基于变精度容差关系的扩展粗糙集及其在数据挖掘中的应用研究[D]. 郑桂玲. 中南大学. 2007

[3]. 基于粗糙集理论的数据约简研究与应用[D]. 胡正耀. 武汉科技大学. 2012

[4]. 面向海量数据的粗糙集理论与方法研究[D]. 王加阳. 中南大学. 2005

[5]. 粗糙集理论若干问题的研究与应用[D]. 孔芝. 东北大学. 2008

[6]. 基于粗糙—模糊集成的分类知识发现[D]. 王莉. 南京大学. 2013

[7]. 基于粗糙集理论的不确定性度量和属性约简方法研究[D]. 滕书华. 国防科学技术大学. 2010

[8]. 汽轮发电机组振动故障集成诊断网络模型及方法研究[D]. 欧健. 重庆大学. 2004

[9]. 粗糙集理论及其在神经网络中的应用研究[D]. 胡莹坚. 浙江大学. 2007

[10]. 基于变精度粗糙集理论的焊接动态过程知识建模方法研究[D]. 黎文航. 上海交通大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

一种新的粗糙集约简定义及其模糊扩展研究
下载Doc文档

猜你喜欢