基于属性约简和属性加权的朴素贝叶斯分类算法的研究

被引量 : 0次 | 上传用户:nbxtihc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘中有很多发现知识模式的方法,本文主要研究了其中的朴素贝叶斯分类模型。数据挖掘在当今互联网时代正发挥着越来越重要的作用,对人们的生产生活、社会的发展和经济的进步都有着巨大的推动作用。分类问题作为数据挖掘中最重要的问题之一也受到各界学者们的关注。朴素贝叶斯分类模型是一种被广泛知晓的分类问题解决方案,但其依然拥有着自身的局限性,即类条件独立性假设:不同的条件属性之间在类决策属性已知的条件下是相互独立的。同时,朴素贝叶斯分类模型认为各条件属性的类条件概率对分类的影响程度是相同的。这虽然简化了算法逻辑,降低了计算复杂度,但却是不完全符合现实生活的,因此导致了在很多应用场景中朴素贝叶斯分类模型不能有理想的分类结果。在结合粗糙集理论和信息论的基础上,本文提出了一种新的基于朴素贝叶斯的分类模型,该模型能够约简掉数据集中的冗余属性,同时计算约简后的各条件属性相对于决策属性的权重,将该权重融入到朴素贝叶斯分类模型中,达到提高朴素贝叶斯分类模型应用场景和分类精确度的目的。本文的主要研究内容有:首先,对贝叶斯理论和朴素贝叶斯分类模型做了研究和分析,介绍了贝叶斯决策准则、极大后验假设以及举例介绍了贝叶斯分类的过程。然后讲述了粗糙集基本理论,以及基于区分矩阵的正域约简算法,并简单介绍了信息论以及信息熵和条件熵的概念和计算方法,在此基础上引出了几种已经存在的利用信息熵和条件熵计算条件属性相对于决策属性重要度的公式,同时给出了利用这些公式来构造加权朴素贝叶斯分类模型的算法步骤。最后本文根据现有的粗糙集理论约简模型总结了利用粗糙集进行属性约简的一般思想,提出了一种基于粗糙集关联规则提取的新的属性约简算法,同时将该算法同已经成熟的加权朴素贝叶斯分类模型相结合,又构造了一种新的贝叶斯分类模型,本文称之为基于属性约简和属性加权的朴素贝叶斯分类模型(RW-NBC)。通过UCI数据集和在WEKA平台上的仿真实验,文章证明了本文所提出的两种算法模型的可行性和有效性。
其他文献
大数据不仅对科技创新、产业发展、经济转型及社会进步有着巨大的影响,而且对劳动力市场的改革也具有至关重要的作用。文章以大数据为视角,研究我国劳动力市场的发展趋势。首
越南酒品暨饮料总公司(TCTRB)透露,到2005年越南将生产100万吨啤酒,2020年将生产150万吨啤酒。预计2005年将需要12.5万吨酿造用麦芽。越南已在北部的高平、谅山、莱州省试种
呼吸道感染是一种比较常见的疾病,呼吸道感染的类型比较多,其中比较常见有病毒性呼吸道感染和上/下呼吸感染等。其中上呼吸道感染是指人体内自鼻腔至喉部之间出现的炎症;下呼
法律适用离不开合同解释。在合同纠纷案件中,合同解释是确定双方权利义务的基础,因此,探明当事人双方意思表示内容就是合同解释的作业。本文以实务中常见的典型二手房买卖中
回顾了2010-2015年间ELSEVIER期刊上69篇关于语言移动学习的研究状况,从文献刊发年份、各国论文刊发数量、研究主题、研究群体教育层次以及移动学习设备等五个方面的研究成果
随着当代科技的进步和国际互联网的发展,网络已经成为影响人们思维和生活方式的重要媒体。在这样的时代背景下,微博作为一种新的交流平台伴随网络发展迅速兴起。与此同时,一
非线性微分方程近几年发展获得众多领域关注,它涉及经济学、物理学及工程学等学科问题数学模型,文中提出运用有限元方法对椭圆型偏微分方程进行求解,分析方程数值解存在可行
近几年我国加快了医药行业的改革,医药流通行业得到快速发展,行业竟争也愈发激烈和受到国家的高度重视。2015年5月18日国家食品药品监督管理总局发布自2015年7月1日起施行201
目的:探索医院青年管理干部系统性、规范化的培训模式。方法:以某医院2012—2015年入院的19名青年管理人员为培训对象,前期拟定培训计划,组织为期三年的规范化培训,培训形式
随着移动技术的大众化,移动学习已成为让教育触及学习者的较好方式。在多角度分析移动学习内涵的基础上,对比国内外移动语言学习应用研究状况,提出开展移动语言学习项目需注意“