基于粗糙集理论的知识发现方法研究

被引量 : 0次 | 上传用户:c_zhang08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是上世纪八十年代初由波兰数学家Z.Pawlak首先提出的一种用于数据分析的数学理论,它能处理含糊性和不精确性问题。自上世纪九十年代起,该理论日益受到重视,并成为国际学术界的研究热点之一。经过二十年的发展,粗糙集理论已在机器学习、模式识别、决策分析、过程控制、数据库知识发现、专家系统等领域获得成功应用。本文主要对粗糙集理论在知识发现中应用的关键问题进行了研究。第一章对知识发现进行了概述,介绍了知识发现的基本步骤、基本方法、基本任务等。而后对粗糙集理论进行了概述,介绍了粗糙集理论产生的背景、粗糙集理论的发展、以及对粗糙集应用于知识发现的优点作了阐述。第二章介绍了粗糙集理论的一些基本概念,并将粗糙集与其他几种处理不确定性理论作了比较。第三章对离散化问题进行了研究,从启发式方法和基于遗传算法的方法两个方面进行了研究。通过对初始断点集进行精简,将Nguyen S H提出的著名的离散化算法进行了改进,改进后的算法在空间复杂度和时间复杂度上都有较大程度的降低;另外,提出了一种免疫算法用于求解决策系统的离散化问题,它与启发式算法相比能获得更小且一致的离散化结果,为粗糙集中连续属性离散化提供了一种新的思想。第四章对于决策系统属性约简问题,从信息论角度定义了一种新的属性重要性度量方法。与基于互信息增益的方法不同的是:这种度量方法不仅考虑了属性的值域的大小,而且还考虑了取值的分布。基于此度量,构造了相应的启发式算法,对多个数据集的实验结果表明该方法能更有效地对决策系统进行约简。第五章研究了决策规则的获取,重点是针对不一致决策系统,提出了一种修改的基于分类一致性的规则获取算法,对每个决策类计算出相应的下近似集与上近似集,然后用决策类的下近似集获得确定性规则,上近似集获得概率性规则。在规则获取时采用属性重要性方法,与LEM2相比,它能一次获得多条规则。通过对Hayes数据集的实验表明了算法的有效性。
其他文献
大肠类癌又称嗜银细胞瘤,其命名源于其细胞颗粒有亲银特性,是一类十分少见的特殊类型肿瘤,胃肠道类癌仅占胃肠道肿瘤的0.4%~1.8%。而十二指肠类癌仅占胃肠道类癌的1.3%,临床表现缺乏特异
玻璃清洗机是玻璃生产中必不可少的设备,清洗大面积曲面玻璃是目前玻璃清洗技术的难题。本文所述的研究工作,是对清洗大面积曲面玻璃的清洗机电气控制系统进行设计。目的在于
江总,字总持,济阳考城人,历任梁、陈、隋三朝,是当时文坛上比较活跃和重要的文学家。《南史》、《陈书》均有传。江总的诗歌创作在当时具有十分广泛的影响,并在一定程度上形
哈尔滨车辆厂是一家国有大中型企业,主要设计、制造和检修铁路货车,具有百年的历史。哈尔滨车辆厂经历了搬迁改造,人员分流,进行了公司改制,成立了哈尔滨车辆有限责任公司(以下简
农村金融是一个特定的历史概念,是一国处于二元经济时期所特有的金融现象。农村金融是农村经济发展最为重要的资本配置方式,是农村经济发展的重要支撑,在农村经济和社会发展
随着变电站通信网络和系统的标准IEC61850的推广使用,电子式互感器、数字化继电保护和测控装置、智能断路器等数字化设备的逐步实用化,过程层和间隔层之间大量的电缆连接将被
《三个女人》(1909)奠定了格特鲁德·斯泰因摆脱19世纪文学进入二十世纪文学的基础。评论家们对《三个女人》的讨论多从女性主义、种族主义、阶级、心理主义和同性恋出发,对
由于事业单位编制数的瓶颈,约束了事业单位在编人员的的发展,造成事业单位使用编制外人员所引起的有利和不利因素及建议。
木塑复合材料是利用木粉、竹粉、果壳粉或农作物秸秆粉和塑料树脂或废旧塑料为主要原料,经高温混合、成型加工而制得的一种新型环保复合材料。满足环保要求的木塑复合材料的
近年来随着我国国民经济的飞速发展和人民生活水平的不断提高,市场对我国造纸产业的需求不断增加。尤其我国加入WTO之后,在经济全球化浪潮的大背景下,我国造纸业将面临越来越