粗糙集的模糊刻画与知识颗粒特征研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:keiryu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对粗糙集的模糊刻画与知识颗粒特征进行了研究.全文的主要内容如下: Z.Pawlak于1982年提出的粗糙集理论(Rough Set Theory)<[1]>是一种处理不完全和不精确信息的新型数学工具.近年来,该理论在计算机科学及多种领域获得了成功的应用<[2、399-17]>.本文第一章对粗糙集理论的产生和发展,研究的主要问题和粗糙集的基本概念等进行了综述. 在粗糙集理论中,一个不精确的概念往往具有一个模糊的不可被明确划分的边界,而边界的存在使得粗糙集中存在着模糊性.在粗糙集理论的实际应用中,有时需要了解一个粗糙集的模糊程度,有时需要在两个粗糙集中比较哪个模糊性更大些或者比较它们之间的相近程度等等.因此寻求一个合适的度量来刻画知识的模糊性是粗糙集理论研究的一个重要方向. Pawlak和Skowron<[47]>提出用粗隶属函数来刻画知识的模糊性.事实上,通过对象的粗糙隶属度,可以将粗糙集中的模糊性用一个模糊集来表示<[48]>,Chakra-banty<[48]>提出了一种通过这个模糊集和与它最临近的清晰集间的距离来测量粗糙集模糊性程度的方法,并给出粗糙集模糊度的一般定义和线性模糊度、二次模糊度的具体形式,研究了模糊度的基本性质:He Yaqun<[49、50]>借助这个模糊集给出粗糙集模糊性测量的熵方法,定义了粗糙集的一种模糊熵,研究了该模糊熵的基本性质;Wei Lili<[51-52]>则研究了一般关系下粗糙集的模糊性和概率粗糙集的模糊性. 针对粗糙集中的模糊性度量问题,本文第二章以粗隶属函数所导出的模糊集为工具,构造了粗糙集的线性模糊度和二次模糊度的一种新的等价形式,并将这两种形式拓展到一般二元关系的情形:研究了两个粗糙集之间的相近程度的度量,提出贴近度的概念,定义了粗糙集的Monkowski距离贴近度、Hamming贴近度、Euclid贴近度、最大最小贴近度、最小平均贴近度和格贴近度;将基于等价关系下粗糙集的贴近度拓展到基于一般二元关系下粗糙集的广义贴近度;讨论了等价关系下利用贴近度来刻画模糊度的一种方法,并由粗糙集的Monkowski距离贴近度、Hamming贴近度、Euclid贴近度、最大最小贴近度、最小平均贴近度和格贴近度,得到了粗糙集的相应的新的模糊度计算公式,利用这些公式可以很方便地度量粗糙集中的模糊性. 在粗糙集理论中,粗隶属函数不仅是描述知识不确定性和模糊性的有效工具,而且可以用来定义一个集合的上近似、下近似和边界域.在这种定义形式下,集合X的下近似RX是那些使μ<,x>(u)的值等于1的元素的全体,上近似RX是那些使μ<,x>(u)的值大于0的元素的全体,边界域bn<,R>(X)是那些使μ<,x>(u)的值介于0和1之间的元素的全体.粗隶属函数可以看成是特殊的模糊集,这样,集合X的下近似和上近似恰好是模糊集μ<,x>的核和支集.事实上,下近似是模糊集μ<,x>的1-截集,而上近似是模糊集μ<,x>的强0-截集.显然,当我们用模糊集μ<,x>描述X的下近似RX和上近似RX时,只考虑了μ<,x>的两个特殊值1和0,而没有考虑μ<,x>的其它值所提供的定量信息,这限制了粗糙集理论的实际应用. 为此,本文第三章从粗隶属函数的角度出发,利用模糊集的截集和强截集的概念,对传统粗糙集的扩展进行了研究,提出了λ-粗糙集和(a,β)-粗糙集,其基本思想都是利用μ<,x>的值所提供的定量信息,对边界bn<,R>(X)中的对象做进一步区分,其具体做法是通过设置阈值参数λ(0.5<λ≤I)和a,β(0≤β(u)的值足够大的部分对象u归入到集合的正域,使μ<,x>(u)的值足够小的部分对象u归入到集合的负域,从而使集合的边界域变小,精确性相对提高。第三章还证明了传统粗糙集、变精度粗糙集和概率粗糙集均可归结为(a,β)-粗糙集,并将基于等价关系的λ-粗糙集和(a,β)-粗糙集拓展到基于一般二元关系的广义λ-粗糙集和广义(a,β)-粗糙集. 粗糙集的所有概念和运算都是通过代数学的等价关系和集合运算来定义的,但这种代数表示的直观性较差,而且也没有知识约简的高效算法.为此,一些学者从信息论的角度对粗糙集理论进行研究,提出了粗糙集理论的信息观<[62.63]>。在 信息观中,文献[72-76]将信息熵、条件信息熵、信息量和条件信息量的概念引入信息系统和决策信息系统,导出了高效的知识约简算法.文献[11,96]建立了信息熵、粗糙熵和知识粒度之间的关系。受此启发,本文第四章从知识粒度的角度对粗糙集与它生成的知识和知识颗粒进行研究,得到了一些有用的结果。 在第四章,提出了知识颗粒的细化和粗化的概念,探讨了知识粒度的一些重要性质和定理.其中,定理4.I.4和定理4.I.5讨论了知识粒度的不变性和粗糙不变性,定理4.I.6证明了知识粒度具有单调性,定理4.1.8和定理4.1.9给出知识粒度的最大值和最小值,定理4.1.11及其推论讨论了知识颗粒细化对知识粒度的影响,定理4.1.12及其推论讨论了知识颗粒粗化对知识粒度的影响。在此基础上,还得到了知识分辨度的一些相应的性质. 从知识粒度的角度对粗糙集进行研究,给出了粗糙集中主要概念与运算的知识粒度表示,证明了知识约简在知识粒度与代数两种不同表示下是等价的,而且知识粒度表示能够导出高效的知识约简算法;利用知识粒度的概念,对完备信息系统和不完备信息系统中属性的重要性进行了定义,并以属性重要性为启发式信息,提出了一种基于知识粒度的甩来寻找完备信息系统和不完备信息系统的属性约简启发式算法,该算法的时间复杂度是多项式的,最后通过实例说明该算法是有效的。 在粗糙集理论中,论域的颗粒化表明同一个颗粒内的对象是一个整体而不是个体,因此,颗粒化带来的信息丢失导致了知识表示的粗糙性.张化光<[123-127]>对这种粗糙性产生的原因进行了研究,他定义了一个集合的基本致粗因子和基本致粗相关因子,并以这两个因子为基础,定义了一个集合的致粗域和致粗相关域,从而将边界域划分为两部分。 本文第五章对粗糙集的致粗域和致粗相关域作进一步研究,得到了致粗域和致粗相关域所满足的一些重要性质和定理:从致粗域和致粗相关域的角度重新认识粗糙集,定义了下精确集、上精确集、精确集、下不可定义集、上不可定义集、不可定义集,探讨了它们的性质;通过分析致粗域和致粗相关域的结构特征对分类精度的影响,又把粗糙集分成可近似下精确集、可近似上精确集、可近似精确集和不可近似粗糙集四类,相应地,把粗糙问题分成可近似下精确问题、可近似上精确向题、可近似精确问题和不可近似粗糙问题。对前三种粗糙问题,分别给出了近似精确化处理方法。实践证明这种近似精确化处理方法比标准粗糙集方法有更好的效果.
其他文献
本文从分析IEEE802.11、HiperLAN、蓝牙(bluetooth)等无线局域网标准入手,详细阐述了以IEEE802.11标准为主的无线局域网。 首先,分析了无线局域网的物理安全和协议安全机制,
介质阻挡放电法是工业上最常用的产生臭氧的方法。在臭氧发生器的电气参数确定的情况下,供电电源的频率成为提高DBD法生成臭氧的效率、提高逆变器的功率密度的、减小输出变压器和交流滤波器的体积和重量的关键。随着逆变电源的频率的提高,出现了开关损耗增加,电磁干扰增大,导体的集肤效应与邻近效应,电容的ESR及磁元件的寄生参数等问题,其中最主要的是开关损耗和电磁干扰问题。为了解决这些问题,软开关技术在臭氧发生器
论文选用Visual Studio 2005作为软件开发平台,结合ArcGIS Engine的二次开发技术,研究并设计了电力地理信息系统平台。论文深入研究地理信息系统相关技术,首先介绍了GIS软件二次开发的背景和国内外的发展现状,可以看出GIS技术已在电力系统中特别是配电网中得到了广泛应用。接着对系统用到的关键技术进行了讨论。其中包括Visual Studio集成开发环境、ArcGIS二次开发工具
湟中县农业“两区”划定工作,通过加强领导、招标单位、制订方案、收集资料、逐块核实、规范管理、定期上报等工作方法,划定总面积28.2万亩,完成目标任务100.6%,其中,小麦生产
交流电机由于其可靠、坚固而且成本相对较低的特性而广泛运用于工业中。它们是由电路、磁路及机械三部分耦合而构成的非线性对象,因此提出了一个复杂多变量的非线性问题。本论文主要涉及交流电机(感应电机与永磁同步电机)的高性能速度控制。 在给出了各种不同坐标系下的数学描述基础上,论文理论上证明了交流电机(感应电机与永磁同步电动机)的电磁子系统满足无源性条件,并且运用无源性控制原理分别给出了有传感器和无传
随着我国风电的快速发展,其在局部地区电力系统中承担的角色逐渐从辅助能源进入到主导能源的行列。现有的对含高比例风电并网的电力系统故障下系统动态问题的研究,大多还是把风电看成辅助能源的角色,研究风电对传统同步机主导的电力系统动态行为的影响。鉴于局部地区风电有逐步取代常规电源成为系统主要电源的趋势,而风机特性又与同步机有很大不同,因此有必要对由风电特性所主导的并网系统故障下系统动态行为进行研究。论文研究
2019年是新中国成立70周年,是全面建成小康社会关键之年,巩固粮食和农业发展好形势意义重大.为深入开展绿色高质高效行动,助力农业供给侧结构性改革和种植业高质量发展,农业
期刊
近年来,随着国内小麦育种技术的发展,新的优质强筋小麦品种在市场上不断涌现.为促进河南省沈丘县优质强筋小麦生产的发展,2018~2019年,沈丘县农业农村局组织技术人员在当地进
期刊