基于多粒度粗糙集的知识发现方法研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:a75838928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在知识发现的诸多理论之中,粗糙集理论是一种对处理复杂数据较为有效的方法,它并不要求提供问题所需处理的数据集之外的任何先验信息,并且与其它的处理不确定性问题的理论有着很强的互补性。在粒计算意义下,经典的粗糙集模型是基于单粒度的,即其目标概念的上、下近似是通过单一属性下的二元关系来刻画的。当面对多源数据、高维数据或分布式信息系统等时,经典的粗糙集将表现出一定的局限性。在此研究背景下,Qian、Liang等人将多粒度的思想引入到了经典的粗糙集模型中,提出了多粒度粗糙集模型。尽管目前多粒度粗糙集的研究工作取得了很多成果,但大多数学者都将精力投入到了提出多粒度粗糙集的拓展模型中,以提高经典模型的建模能力,却很少有人研究在多粒度粗糙集模型下的知识发现方法。在多粒度粗糙集模型下如何高效可行地实现对数据集的有效的知识发现应当予以重视。为此,本文以多粒度粗糙集理论为研究背景,对基于多粒度粗糙集的知识发现方法进行了系统性的研究,主要研究了以下内容:(1)研究了在多粒度粗糙集模型下如何对信息系统进行信息粒化,以得到粒度空间和信息粒。与此同时,本文对于在多粒度思想下如何进行信息系统的信息粒化也做了一定的阐述。(2)提出了基于多粒度粗糙集的规则提取方法。它主要包含了粒度选择方法、粒选择方法和基于多粒度粗糙集的规则描述。其中,本文提出的粒度选择方法使用的是一种启发式策略,消除了信息系统中对目标概念近似作用并不大的相对冗余的粒度空间,以得到某个相对较小的粒度空间集;粒选择方法则采用了一种乐观策略,去掉了用于描述决策属性下近似的信息粒集合中对提取具有较好泛化能力的决策规则意义并不大的信息粒,以获得一个具有极大覆盖性质的粒集;基于多粒度粗糙集的规则描述是将最终求得的信息粒集合中的所有对象都描述成多粒度粗糙集模型下的决策规则。(3)研究了如何将基于多粒度粗糙集的知识发现方法运用到多粒度粗糙分类器的设计之中;与此同时,通过实验证明了基于多粒度粗糙集的规则提取方法(特别是启发式的粒度选择方法和乐观的粒选择方法)的有效性。本文对多粒度粗糙集的知识发现方法进行了系统性的研究,提出了基于多粒度粗糙集的规则提取方法,通过使用该方法,信息系统中对目标概念近似作用并不大的粒度空间和相对冗余的信息粒都能得到一定程度的减少,进而用提取出的决策规则所构建的多粒度粗糙分类器将拥有更好的泛化能力。
其他文献
本文论述了人力资源管理系统的发展、特点及研究现状,采用组件和中间件技术,建立了系统组件模型,研究了以J2EE为平台的基于组件的人力资源管理系统。以软件工程理论为指导,应用UML, EJB, JSP等多种计算机新技术,对人力资源管理系统进行了开发。同时,系统以提供人力资源供给预测为目的,研究了决策支持系统、数据仓库及数据挖掘技术并应用到人力资源管理系统中,建立了人力资源供给预测数据仓库。以此为基础,
基于手纹的生物特征识别是一项极具发展潜力的生物特征识别技术,具有十分重要的理论和应用价值。由于其具有无侵害性、成本低、使用友好等优点,得到广泛的关注和重视,近年来
With the development of Internet technology, methods, and tools of the development of information systems, especially in electronic commerce field, leads to mak
软件测试是保证软件质量的重要手段,也是软件开发过程中一项非常重要的工作。一直以来,国内的很多软件企业对于软件测试的重要性缺乏足够的认识,测试水平不高,软件质量无法得到保
随着Web服务的日益广泛应用,它的安全性问题显得越来越重要,并已成为制约其发展的关键性因素。如何向开发者提供一个比较合理的安全代理模型,以满足Web服务特定的安全性需求,从而
胎儿心率是衡量胎儿健康状况的一项重要信息。正常胎儿的心率应该在每分钟120~160拍范围。当胎儿的心率过高或过低,表示胎儿可能有缺血或缺氧的情况,严重的胎儿缺血、缺氧会导致
随着互联网技术深入到人们社会生活的各个行业领域,如金融行业、通信服务行业、煤炭行业、石油行业、食品流通行业等,人们的日常生活与互联网的关系日益密切,与此同时,对网络实时
随着市场的发展电信运营商之间的竞争越来越激烈,这使每个运营商都必须以客户为中心,随时准确了解用户消费情况和消费动向,作为运营商的老大为了保住绝对老大,就必须作这方面的改
在设计现实环境中的Agent时,BDI模型是一种常用的Agent体系结构设计方法。在该模型中,Agent根据它的信念来选择一定的愿望(目标),作为它要实现的意图。由于现实环境通常具有如下
随着人工神经网络的深入研究,人工神经网络方法已在许多领域获得成功运用。神经网络的主要特点体现在其具有信息处理的并行性、分布式的信息存储、自组织性和自适应性、具有