关于朴素贝叶斯分类算法的改进

被引量 : 0次 | 上传用户:bjjgx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是机器学习领域中的一门技术,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用上的需求。贝叶斯分类器是数据挖掘分类算法中其中之一。它是以贝叶斯定理、最大后验假设、贝叶斯网络和信息学理论为基础。该算法利用先验统计知识具有简单易于计算、能有效处理混合指标属性的分类问题和较好的分类能力等特点,已经成为目前数据挖掘技术的理论和应用研究方法之一。本文主要工作是朴素贝叶斯分类模型的研究和应用。1.首先介绍了贝叶斯分类的基本理论。2.其次总结了几种常用的贝叶斯分类模型:朴素贝叶斯分类模型、CB分类模型、基于属性相关性的分类模型、EANBC分类模型、基于特征加权的朴素贝叶斯分类模型和强属性限定的贝叶斯分类模型。3.本文的重点是对朴素贝叶斯分类算法的进行改进。将卡方统计量的构造思想用于构造属性的相关性度量公式,以此改进贝叶斯分类算法。并通过实验证明了本文提出的改进算法能有效地提高分类效果。最后,对全文进行了总结和展望。
其他文献
中式住宅以它独到的文化视角,迎合了人们对逝去时空的依恋和文化回归的心理诉求。因此,近几年来它频频亮相,以燎原之势蔓延。虽然,中式住宅设计已经取得了一定成就和发展,但
高血压病是全世界流行最广的心血管疾病,它不仅使心、脑、肾等重要脏器受损,而且是动脉粥样硬化的首要危险因素,因而成为心血管疾病防治工作中的重点[1]。至今,原发性高血压(E
党的十六届四中全会指出,建立和完善社会舆情信息汇集和分析机制,畅通社情民意反映渠道,这体现了党中央对舆情研究的重视。近年来,国内学术界对舆情问题的研究日趋深入,取得
人的手部运动的参数检测可以在多方面得到应用,如手部运动功能评估、配合电刺激等控制方式的肢体康复治疗等。手部运动检测有多种不同的方法,从最早的测角仪、磁传感器、普通
知识产权请求权是基于知识产权受到侵害或者有受到侵害之虞而产生的一种救济权利。知识产权与物权同为绝对权的属性,决定了它们在绝对权请求权的制度配置上应该具有一致性。
疲劳驾驶一直都是引起交通事故的主要原因之一。疲劳驾驶可以导致驾驶员一系列心理运动操作能力受损,如唤醒水平降低,认知功能下降等,而其中注意力受累最为显著,表现在对外界
作为美国当代文坛的杰出代表人物之一,E.L.多克特罗一直以其将历史与虚构的文本相融合的文学创新为人们所熟悉,被冠以"后现代派作家"。然而通过对其创作理念及创作实践的深入研
J.M.库切是南非历史上第二位获得诺贝尔文学奖的作家。其作品反对种族隔离,反对压迫与暴力,关心弱者,同情边缘群体,表达了对人类前途命运的终极关怀。然而,通过细读的方法,笔
全世界苦木科鸦胆子属植物有6种,我国有2种,为鸦胆子和柔毛鸦胆子。该属植物为灌木类植物,属中的6种植物都不同程度地应用于当地的民间用药,具有多种药理活性。苦木科鸦胆子
改革开放以来,我国城市个体户在社会经济发展的过程中发挥了非常重要作用。经济决定政治,城市个体户为经济发展做出了重大贡献,理应政治地位也得到提高。但是在现实生活中,其