【摘 要】
:
作为数据挖掘领域中一项重要的技术,分类技术在许多方面有着广泛的应用,目前存在着很多的分类技术,如决策树、支持向量机等。为了达到比较好的预测效果,传统的操作中,常常通
论文部分内容阅读
作为数据挖掘领域中一项重要的技术,分类技术在许多方面有着广泛的应用,目前存在着很多的分类技术,如决策树、支持向量机等。为了达到比较好的预测效果,传统的操作中,常常通过训练集产生多个分类模型,再用测试集逐个测试其分类性能,把性能最好的一个作为最终的分类模型。但是单个分类模型的预测性能毕竟有限,而且每个分类器都有其适合分类的数据区域,它可能对测试集表现出比较好的效果,但是对待测数据却没有很好的效果,这体现了单个分类器分类性能的不稳定性。而通过对多个单分类器进行有效地组合既可以提高分类的性能,又可以保证预测结果的稳定性,在这种情况下,分类集成技术应运而生。分类集成技术主要是通过对多个单分类器进行组合来提高分类性能,这些单分类器被称为基分类器,它主要包括两个部分:基分类器的产生方式和基分类器的组合方式。Boosting算法是分类集成学习中比较有代表性的方法,它产生基分类器时,通过在训练集样本上维护一套权重分布,使每次训练产生的基分类器关注不同的样本;Bagging方法也是一种比较重要的分类集成技术,它通过每次有放回抽样来产生基分类器,每个样本被选中的机会是完全相等的。MultiBoost方法可以看作Boosting方法和Wagging方法的结合,经过验证,它相对于Boosting方法和Wagging方法有较低的错误率,它主要是对训练集指定一套符合泊松分布的权重,然后生成基分类器。本文通过对这些方法进行分析,提出了两种改进的训练集样本加权方法用于产生基分类器。.基分类器的组合方式是分类集成中另一个重要的方面,在基分类器的输出是类别的情况下,目前常用的是投票法;Bagging方法用的是简单投票法,每个基分类器的投票在最终决策中是相同的,Boosting方法是根据基分类器的分类错误率对每个基分类器给予一个投票权重,最终的决策运用有权投票技术。本文详细分析了有权投票技术,在此基础上,针对不同方面的考虑,提出了两种投票权值调整的方法。最后通过实验对本文所提算法进行了实验验证,结果显示,本文所提方法可以进一步提高分类性能。
其他文献
随着新硬件的出现以及新应用领域的发展,人机交互活动越来越成为人们日常活动中一个重要组成部分。由于人手具有的多样性、多义性,以及在时间和空间上的差异性等特点,加之人
随着计算机技术的迅速发展以及网络的普及,越来越多的用户开始通过网络进行各种信息的分享与交流,社会网络的概念也应运而生。在社会网络中,每个行动者都与其他行动者有或多
随着互联网和信息技术的飞速发展,日益增长的隐私问题已经成为信息共享的主要障碍。如何有效保护发布数据中含有的个人隐私信息已备受人们关注。基于k-匿名模型和l-多样性模型
在实时数据库VegeBam1.0的基础上构建实时数据库系统VegeBam2.0的系统架构,并在研究的基础上开发了一个具有自主知识产权的实时数据库系统VegeBam2.0。主要内容如下:描述了实
监控视频下的行为识别是计算机视觉领域的研究热点之一,本文对其从时空关系挖掘的角度进行研究。首先,提出针对监控下异常行为的基于时空一致性光流特征分类的行为识别技术,获得了很好的识别效果;进一步,针对干扰识别效果的重要因素之一——阴影问题,提出了基于马尔可夫时空关系建模的移动阴影检测方法,获得了很好的阴影检测结果,从而有助于取得更佳的行为识别效果。(1)基于时空一致性光流特征分类的行为识别为了区分视频
随着计算机网络信息时代的到来,企业信息的安全问题已经越来越多的被广泛关注。对于企业来说,不仅要杜绝来自企业外部的攻击和破坏,更要防止来自企业内部的有意或者无意的泄密行
随着当代高铁技术的蓬勃发展,列车速度不断提升,铁道线路快速延伸,这就对列车到达预警的很多性能参数,如预警距离、系统功耗成本、扩展性、抗干扰性等提出了更高要求。面对这
随着互联网的不断发展,网络已经成为了人们获取信息的重要来源。但是网络信息的快速增加,使得人们快速准确查找信息的难度也不断增大。搜索引擎的出现,就是为了帮助人们解决这个
移动机器人路径规划问题是机器人研究中的关键技术,一直以来是国内外学者热衷的研究课题。然而,传统的路径规划方法都存在各自的缺陷,所以寻求更佳的算法就成为该领域的一个研究
随着智能互联网时代的到来,人们迫切需要一些技术手段从海量数据中自动快速地找到符合用户感兴趣的数据,个性化推荐技术就此诞生。协同过滤(Collaborative filtering,CF)算法是推荐技术中最成熟的技术之一。在面对日益增长的大规模用户和项目时,由于用户评分的有限性以及新用户和新项目的增加,CF算法还存在着一些问题亟需解决。针对CF算法自身存在的缺陷及现有问题解决方法的不足,本文对其进行