朴素贝叶斯与决策树混合分类方法的研究

来源 :大连海事大学 | 被引量 : 23次 | 上传用户:lhwgppp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,并且能有效地从低信噪比数据中挖掘有价值的信息。分类的模型主要包括朴素贝叶斯、决策树、支持向量机等。朴素贝叶斯和决策树以算法简单、计算量小以及分类结果对噪音鲁棒等特点而得到广泛运用。本文从以下几个方面着眼,改进朴素贝叶斯和决策树算法:(1)尽管朴素贝叶斯的分类结果受到广泛承认,但是面对某些特殊情形,依然存在两个缺陷,即属性间必须满足独立的条件,以及概率估计方式粗糙的问题。针对朴素贝叶斯概率估计粗糙的问题,本文提出了基于朴素贝叶斯的概率优化算法。将概率优化函数运用到朴素贝叶斯中,充分考虑到朴素贝叶斯中条件概率为零的属性,从而避免了朴素贝叶斯易下溢和过度拟合的问题。本文采用了UCI数据集进行了多组验,与传统分类算法进行比较。实验结果表明在高维数据中,基于朴素贝叶斯的概率优化算法算法提高了分类准确率,表现出了优良的性能。(2)在针对多类标签的分类问题上,文中介绍了朴素贝叶斯与决策树的混合分类算法,由于在训练集中存在有噪声矛盾的实例,将使决策树遭遇过度拟合并且致使精确度下降。在构造决策树之前运用本文提出的朴素贝叶斯的概率优化算法进行预处理,来移除训练集中的噪音实例,从而避免决策树算法的过度拟合。本文采用UCI数据集,采用10倍交叉验证的方法,对论文中提出的算法进行实验。通过大量对比实验显示,本文中提出的方法产生了较好的结果。朴素贝叶斯与决策树的混合算法还允许我们自动的从拥有高维属性的噪声数据中抽取最具有代表性和高质量的数据集,并且根据不同的实例特征挑选出重要的属性。(3)本文将提出的朴素贝叶斯的概率优化算法和朴素贝叶斯与决策树的混合算法应用在冠心病中医辅助诊疗系统中,成功地对病人病症进行了分类,在冠心病的诊疗过程中起到了有效的辅助作用。
其他文献
在电气自动化迅猛发展的今天,随着硬件水平的不断提高和故障录波器等设备的发展,数字化微机保护装置的功能与性能也在不断完善。但是各种数字化微机保护以及故障录波器往往因
近年来,高能耗与产品品质受影响成为农产品与食品干燥中最常见的问题。干燥属于高能耗操作,根据相关资料数据可以发现,大部分发达国家超过12%的工业能耗都应用在干燥工艺,且
本文从论述档案在人类社会进步与发展的重要作用入手,就目前一些基层单位档案管理工作现状,提出如何加强基层档案管理工作的初步设想。
目的检测食管、贲门癌组织中人类趋化素样因子超家族(CKLFSF)成员CMTM4、8的表达并探讨其临床意义。方法使用组织微阵列(TMA)和免疫组织化学方法(IHC)检测60例食管癌和贲门癌肿瘤组
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
研究背景及目的:卵巢早衰(Premature Ovarian Failure)是指女性40周岁之前因性腺功能衰竭,伴促性腺激素增高、雌激素低下,可有一系列围绝经的临床表现,如潮热、多汗、不孕等症状[1]
在当今知识剧增的时代,知识和信息对于各种从事复杂专业技术工作的人才来说显得格外重要。知识激励主要包括:(1)向各类人才提供必要的知识更新和获取信息的机遇。如定期输送到大
前牙开合畸形由于其开合涉及范围较大,矫治难度较大,且具有较高的复发率,给治疗带来了较大的困难,因此一度成为口腔科比较棘手的重要问题。但随着医疗技术的进步,该问题也逐
简要介绍了有机波谱分析化学课程的内容及原理,详细阐述了在该课程教学中进行的4个方面的改革。
设计了一种单通道USB总线数据采集系统的设计过程,硬件部分主要是借助采集卡和热敏温度传感器进行连接来进行数据采集的,并通过USB端口输入到计算机中。本文重点是该系统软件部分的设计,该系统的设计所采用的是VC6.0软件开发平台,利用VC++中MFC编程的思想方法,建立了友好的系统可视化通讯界面,研究方向主要是PC接收到信号以后在界面中显示出来,具有动态显示,数据处理,保存等功能。因此该系统具有操作简