SVM与AdaBoost算法的应用研究

被引量 : 42次 | 上传用户:mafenqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机是Vapnik于1995年首先提出的,主要用于解决小样本、非线性和高维模式识别问题,并且能够推广应用到函数拟合等其他机器学习问题中。它是建立在统计学习理论的VC维理论和结构风险最小原理的基础上的,根据有限的数据样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力。AdaBoost是最著名的Boosting算法之一。AdaBoost作为最常用的算法,已经被用于机器学习的各个领域。随着AdaBoost算法的广泛应用,越来越多的学者致力于研究以不同的方式去改善和提高算法性能。嵌入式多视角AdaBoost (EMV-AdaBoost)算法是将多视角学习彻底融合到AdaBoost算法中,而且最终假设是一种新的多学习器组合的方式。本文详细研究了支持向量机的相关理论和AdaBoost算法相关理论,然后分别利用支持向量机和嵌入式多视角AdaBoost完成了组块识别任务。首先详细介绍了支持向量机的相关理论,最优超平面、核函数、多值分类问题及支持向量机的解法等,对支持向量机的分类原理进行了研究。同时,详细介绍了AdaBoost算法相关理论,从Boosting算法,算法分析到AdaBoost算法再到嵌入式多视角AdaBoost算法。着重介绍了嵌入式多视角AdaBoost算法的算法步骤和算法分析。然后,阐述了汉语组块识别任务,组块的定义和标注方法,并把汉语组块识别转换为分类问题,将每个汉字用数字向量表示。最后,分别利用支持向量机和嵌入式多视角AdaBoost算法完成了组块识别任务,并利用北京大学计算研究所的语料库做了测试。实验结果为支持向量机和嵌入式多视角AdaBoost算法在组块识别中的综合评价F值分别为72.87%和84.06%。本文的研究结果不仅可以应用于语言翻译系统,还可应用到文本分类、信息检索等其它自然语言处理领域中。
其他文献
随着教学改革的逐步深入,探索能有效提高教学质量和学生专业素质、创新精神和综合能力的新的教学模式成为体育教育工作者所面临的重要课题。本文对师范院校体育教育专业挺身
总结20世纪90年代以来柞蚕新品种选育研究的技术进步、成果水平及产业化程度,简要介绍了不同类型的柞蚕新品种选育在技术方法上的创新及目前二化性地区主要应用的部分实用品种
本文通过石家在市某工程实例,对《建筑地基基础设计规范》(GBJ7-89)应用标贯试验评价地基土层承载力的问题进行了探讨。
近几十年来,国际融资租赁已发展成为颇具活力的朝阳产业。由于其开拓国际市场和引进外资改进技术的双重功效,深受发达国家以及发展中国家的青睐。在发达国家大力宣扬国际融资
目的观察羟喜树碱联合三尖杉酯碱和阿糖胞苷(HA方案)治疗加速期或急变期慢性粒细胞白血病的疗效。方法羟喜树碱5 ̄10mg/d,连续应用7 ̄14d,联合HA方案,治疗进入加速期或急变期的慢
开展阳光体育运动是在我国学生体质健康水平下降的大背景下产生的。在《决定》中明确指出:“开展阳光体育运动,要与课外体育活动响结合。将学生课外体育活动纳入教育计划,形成
通过在科学考察船多年的工作实践及探索,从设备管理、安全管理以及人员管理3个方面阐述了科学考察船在轮机管理方面的基本特点.对原有的管理方法进行了改进,保障了科考工作的
目的探讨隐神经髌下支神经痛诊断与注射治疗的解剖学基础。方法收集门诊自2001年10月至2009年9月间确诊的隐神经髌下支自发性神经痛16例,采用强的松龙加局部麻醉药注射至神经
从评估主体、评估客体及评估中介等科技评估基本要素入手,全面分析国外科技评估现状特点;针对我国科技评估现存问题,提出建立科技评估中介机构服务体系、加强评估人员管理、提高
益生菌能够调节肠道生态平衡,对宿主产生健康的影响,最受关注的是乳酸菌和双歧杆菌。随着益生菌产业的不断发展,越来越多的益生菌被开发和应用。在益生菌筛选过程中,胆盐耐受