基于属性选择的朴素贝叶斯分类研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:sallen009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯分类方法能够较好地处理各种数据类型,随着中医诊断在规范化和量化方面的进步,越来越多的学者将贝叶斯分类方法应用在中医诊断中。朴素贝叶斯分类算法(NBC)作为其经典算法之一,具有结构简单、计算高效的优点。但NBC基本条件独立性的假设,限制了其使用范围;另外,随着数据量的增大,在实际数据集中常存在一些冗余属性,降低了NBC的学习效率和分类性能。为了更好地适应实际需求,本文以NBC为基本对象,从属性选择、属性加权和结构扩展三个方而对NBC进行改进,并将改进后的模型应用到不孕症中医诊断问题中,通过实验验证了其有效性和准确性。首先,为提高分类准确率,本文提出一种基于 KL距离与分裂信息的属性权值计算方法,并将此权值作为隐朴素贝叶斯模型(HNB)中属性的加权系数,提出一种改进的加权隐朴素贝叶斯分类算法(WHNBC)。实验结果表明了与其他分类算法相比,WHNBC算法提高了分类准确率,这也从侧面验证了本文提出的属性权值计算方法的正确性和有效性。其次,针对实际应用数据中存在冗余或无关属性的问题,本文在基于相关的属性选择算法基础上引入了Pearson相关系数和属性之间相关度方差的概念,提出了VCFSPabs属性选择算法。实验结果验证了该算法可以有效地去除冗余属性并获得良好的属性子集。然后,在属性子集和WHNBC算法的基础上,本文提出了一种基于属性选择的改进加权隐朴素贝叶斯分类模型(AS-WHNB),该模型主要由属性选择、属性权值计算以及模型的分类训练三部分组成。其中,在模型分类训练部分,我们将属性选择部分获得的属性子集,进一步划分为强属性子集和弱属性子集,并在两个子集上分别采用WHNBC模型和NBC模型进行训练。实验结果表明,当属性数目较多时,AS-WHNB分类模型不仅提高了分类准确率,还有效地降低了分类消耗时间。最后,我们对临床采集的不孕症数据集进行预处理,并将NB、C4.5、TAN、 AODE、WHNBC算法以及AS-WHNB分类模型应用到不孕症中医诊断问题中。对比并分析实际的实验结果可以发现,AS-WHNB分类模型具有较好的分类性能,这表明本文提出的AS-WHNB分类模型为不孕症中医诊断建模提供了一种好的思路和方法。
其他文献
当前,新媒体的影响力越来越大,在给生活带来信息快捷方便的同时,人们思想意识形态也出现了多元化倾向,主流意识形态的宣传受到了严峻挑战。在这种新形势下,传统媒体应该怎样做好主
随信息爆炸和Web3.0时代到来,个性化推荐应用越来越广泛,但位置数据缺失问题常导致无法提供真正满足用户个性需求信息,而随着移动互联网迅猛发展、移动终端逐渐普及、空间信
<正>"研修"是"研究"与"进修"两个词的合成词,校本教研和校本研修有着很大的不同,"校本教研"模式,主要用于在职教师的继续教育,其基本内涵是为了学校而进行教师专业发展的培训
目的探讨左氧氟沙星在耐多药肺结核治疗中的疗效。方法选取94例笔者所在医院于2018年2月~2019年2月所收治的耐多药肺结核患者随机分为对照组和研究组,对照组患者行常规抗结核
利用多种形式、生动活泼的教育教学方法,激发学生的学习兴趣,充分调动学生学习的主动性、积极性和创造性,可以一改传统课堂教学沉闷、枯燥、单调的气氛,使初中地理教学出现繁
<正> 甲状腺机能亢进症是多发于青壮年的疾病,其发病诱因据文献记载与感染,精神创伤,遗传,妊娠和分娩等因素有关。此病在治疗方面可分外科手术和内科疗法,常用药物如芦戈氏液
去年本刊第十期刊发韩光荣同志道教《河车功》法入门后,颇受广大读者欢迎,现续发《河车功》中的《精、气、神与气功关系》一文,望读者能从中受益。——编者
物理实验课在培养学生创造性解决问题的能力上具有不可小视的作用,各高校面临着教学效果不佳的困扰,通过观察与实践,我们总结了放开、应用、简要与创新等经验,教学效果明显改善。
目的 探讨经皮椎体成形术(PVP)并发症的发生原因及预防.方法自2001年5月~2003年10月共行经皮椎体成形术43例,64个椎体.出现并发症13例,发生率为30.2%.单纯发生骨水泥PMMA渗漏,未产生临床症状4例;发生渗漏,且术后疼痛症状加重3例;无渗漏,术后疼痛症状加重4例;手术后期手术相邻椎体新发压缩骨折2例.术后随访3~29个月(平均13.2个月).结果7例术中出现渗漏者,均未产生严重