基于直觉模糊集的决策树算法研究及应用

来源 :北京交通大学 | 被引量 : 6次 | 上传用户:ytrewq123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为机器学习和数据挖掘经典的分类模型之一,决策树算法因其简单易懂可复用性强等优点得到了广泛的应用。经典的决策树算法不能处理模糊环境下的分类问题,基于模糊集理论,提出了模糊决策树算法(Fuzzy Decision Tree,FDT)。FDT是经典决策树在模糊集下的扩展,是将一个本来杂乱无序的样本数据进行模糊处理后生成一棵可用于分类预测的模型。模糊决策树的优势在于决策树广泛的应用性和表达知识的易被理解性,以及利用模糊理论去处理模糊信息的能力。FDT已经在医疗、交通、金融等领域得到了广泛的应用。FDT本质上是一种有监督的数据分类模型,通常使用隶属度来表示样例隶属于结点的程度。但是在实际的数据分类过程中,不仅要考虑样例隶属于结点的程度,还需要考虑不属于结点的程度,显然FDT不能全面表述这类分类信息。直觉模糊决策树(Intuitionistic Fuzzy Decision Trees,IFDT)的提出解决了这一问题,但现有的IFDT算法只给出了构建的思想,缺少完整的构建的过程,而且计算直觉模糊熵的方法在某些情况下不满足限制条件。因此,本文提出了改进的直觉模糊决策树算法(Improved Intuitionistic Fuzzy Decision Trees,IIFDT),修改了 IFDT 计算直觉模糊熵的方法,并提出IIFDT的剪枝方法、规则抽取方法、分类预测方法。IIFDT包含了完整的构建过程,改进了 IFDT计算直觉模糊熵时不满足限制条件的情况,更具有普适性。此外,将IIFDT应用在糖尿病诊断中,并以此算法为核心开发了基于IIFDT的糖尿病辅助诊断系统。本文的研究内容主要包括以下三点:(1)论述IFDT的构建思想,梳理FDT的相关理论,总结不同的FDT选择扩展属性的方法和剪枝方法,并梳理直觉模糊集相关的基本概念,坚实了构建IIFDT的理论基础。(2)构建IIFDT模型。推导IIFDT构建的过程,包括属性的模糊处理、扩展属性的选择标准、IIFDT的剪枝处理、IIFDT规则的抽取、IIFDT的分类预测。并以一个算例为例完成IIFDT模型的构建,最后使用三组公开的数据集将IIFDT和其他几种算法进行了对比分析,证明了本文的算法的优势。(3)开发基于IIFDT的糖尿病辅助诊断系统。以IIFDT算法为核心,设计并实现基于IIFDT的糖尿病辅助诊断系统,包括系统需求分析、框架设计、详细设计,人员管理模块、数据处理模块、糖尿病模型构建模块、糖尿病辅助诊断模块的功能实现。最后通过对诊断结果的比较分析,说明IIFDT模型在糖尿病辅助诊断中应用的可行性,以及该系统具有一定的应用价值。
其他文献
2.2.6腐鳃病(gill fouling)淡水螯虾鳃表面通常会附着丝状藻类或者革兰氏阴性菌,还可能存在一些原生生物等,在正常情况下,
公路交通的快速发展极大地方便了人们的出行,同时也带来了日益增加的交通压力,各类交通事故、状况屡见不鲜,给人们的日常出行带来了许多困扰。为了改善这一现状,我国各线城市
生涯管理对大学生具有非同寻常的意义,然而大学生的生涯管理不是一个简单的生活管理,它应该有一个指导思想。大学生接受高等教育的目的是更好的为社会及所服务的组织创造财富
随着我国城市化进程的不断加快,对城市的功能和服务水平提出了更高的要求,产生了大量的基础设施需求。在这些为城市提供公共服务的设施中,有一部分设施可能会因为对周边居民
今年上半年,供给侧结构性改革深入推进,高质量发展基础加紧夯实,混凝土与水泥制品行业平稳增长,产能利用率提高,产业结构继续优化,行业经济总体呈现出运行平稳增长特点,但部
信息环境下智能火力与指挥控制系统是建立在航空火力与指挥控制系统发展基础之上,与信息化、网络化作战理念相互适应,满足现代战争军事需求,与新一代战斗机同步发展的新型分
本论文旨在研究鞘氨醇单胞菌QYY(Shingomonas xenophaga QYY,编号为CGMCC 1172)对蒽醌染料中间体1-氨基蒽醌-2-磺酸的好氧降解特性,分析蒽醌环裂解过程;并拓展底物范围,研究菌
能源消耗及其产生的排放引起的生态环境恶化越来越受到全社会的关注。在交通运输部积极推动绿色公路的环境下,厂拌乳化沥青冷再生、水泥再生土、高聚物注浆等具有节能减排效
文章从企业价值指标、财务指标和税收筹划指标等三维度考察我国农业企业经营绩效的影响因子。研究表明:我国企业股权集中度呈现从高度分散到高度集中的无序状分布;经营收入与
为准确利用机器视觉对道路垃圾图像进行识别及提取,在对现有纹理特征提取方法基础上,提出一种纹理特征融合与支持向量机(SVM)相结合的分类识别方法。对局部二值模式(LBP)进行