【摘 要】
:
分类回归树(CART)算法在处理特征类别较多的数据以及相关性较强的数据集时,分类准确率也会受到影响,并且没有学者研究进行特征选择后的CART算法来分类医学数据集。同时,有学者将贝叶斯理论与CART相结合用于分类数据集,主要利用先验概率来和分裂准则来规范树模型的大小,在分类的过程中对精确度有一定的影响。传统的先验规范有一定的缺陷,而且这些方法的研究已经趋于成熟。在此基础上,找到一个合适的先验概率和分
论文部分内容阅读
分类回归树(CART)算法在处理特征类别较多的数据以及相关性较强的数据集时,分类准确率也会受到影响,并且没有学者研究进行特征选择后的CART算法来分类医学数据集。同时,有学者将贝叶斯理论与CART相结合用于分类数据集,主要利用先验概率来和分裂准则来规范树模型的大小,在分类的过程中对精确度有一定的影响。传统的先验规范有一定的缺陷,而且这些方法的研究已经趋于成熟。在此基础上,找到一个合适的先验概率和分裂准则更有利于提高基于贝叶斯理论的CART分类算法的性能。因此,本文在特征选择算法的基础上进一步改进CART算法的分类性能来正确分类数据集。首先,对于类别较大的乳腺癌数据集,为了节约计算成本,提高算法的分类准确率,比较了CART算法基于不同特征选择算法下的分类准确率;对最高分类准确率附近的准确率进行拟合,得出在最优特征子集附近,CART算法的准确率近似服从泊松分布。其次,证明了熵与基尼指数相似,将熵作为CART算法的分裂标准;根据分类准确率受特征数的影响,提出了一种重要性特征先验概率;在贝叶斯理论框架下,给出了一种基于重要性特征先验的Bayesian CART算法,通过证明最大后验概率对应于最小熵,给出了选择树的标准。最后,建立了基于重要性特征先验的Bayesian CART算法的分类模型,并且在乳腺癌数据集和肝炎数据集上进行分类;通过与CART算法和基于特征选择的CART算法进行比较,得到了基于重要性特征先验的Bayesian CART算法具有更好的分类准确率。
其他文献
超燃冲压发动机(Scramjet)是高超声速飞行器推进的理想动力装置,其具有结构简单、储运方便、稳定性好、不携带氧化剂、比冲大等优点,是一种具有广阔发展前景的技术,在航空航天和国防军事领域具有重要意义。在超燃冲压发动机的几大结构中,燃烧室是唯一的主动件也是最重要的结构。而燃烧室内壁面热流和燃气辐射传热对壁面热防护的优化设计和燃烧室内超声速燃烧的稳定性有着重要的作用。国外学者已经通过自定义求解器采用
<正>在今年的两会中,"减税降费"这个关键词毫无疑问地占据了"C位"。2019年以来,个人所得税6项专项附加扣除、小微企业普惠性税收减免、深化增值税改革……这一系列减税降费举
目的:评价多模磁共振弥散-灌注不匹配对发病在4.5小时内急性缺血性脑卒中患者静脉溶栓预后的影响.方法:入选发病4.5小时以内的前循环脑梗死患者,立即行多模MRI检查(T1WI,T2
目的:分析新生儿病理性黄疸的病因,探讨其有效治疗方法。方法:选取我院2010年5月-2011年5月儿科收治的173例新生儿病理性黄疸患者临床资料,对其病因及治疗效果进行回顾性分析。结
我国自加入世界贸易组织以后,与很多国家之间的往来愈加频繁,国家的进步与企业的发展逐渐演变成人才的竞争。因此,我国的美术教育事业备受重视,教育界开始不断创新教育理念和
本文主要论述潜阳丹在戊戌年五之气及其气交期间应用的经验分析。论述五之气期间运气对人体生理病理影响、产生的症状表现,探讨在五之气使用潜阳丹的理论基础。并通过病案分
BiCuSeO基含氧TE材料由于特殊A/B层交互排列结构及对应的对载流子和声子的限域效应,表现出较高的本征塞贝克系数S和低热导率κ,其较好的热稳定性和化学稳定性能提升对应热电
文章作者实录了自己的高中班主任工作的过程,并以一些具有代表性的事例表达了自己的一些见解,体现了一位优秀的班主任的管理智慧和他的反思精神。
尊敬的罗卫红副市长,各位领导、各位来宾,女士们、先生们:大家上午好!今天,闽浙赣皖四省九市的各位嘉朋云集于此,纵谈职业教育创新合作发展大计,请允许我代表浙江省教育厅,对前来参