基于代表示例选择与SVDD的多示例学习算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:jackyong63
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多示例学习概念是上世纪90年代由Dietterich等人在研究药物活性预测问题时提出的。在多示例学习模型中,训练样本的类别标记歧义性不同于传统机器学习模型,使得多示例学习成为一种全新的机器学习框架。多示例学习具有独特的视角和广泛的应用前景,且在以往机器学习领域中尚未被深入研究,被认为是与监督学习、无监督学习以及强化学习并列的第四种学习模型,在国内外机器学习研究中受到了极大关注。随着多示例学习研究的深入,与多示例学习相关的理论体系和算法逐渐发展成熟,目前主要有两类方法用于解决多示例问题:生成式方法和判别式方法。生成式方法是早期研究多示例问题常用的方法,其目的是在示例特征空间中确定出感兴趣区域,使得正示例都位于该区域内,而负示例都远离该区域,它通常用最大似然进行求解。判别式方法旨在将多示例问题转化为标准监督学习问题,通过改变目标函数的约束条件或采用某种消除歧义性策略,将多示例学习问题转换为标准的单示例传统机器学习问题。根据这两种解决多示例学习问题的思路,研究者设计了大量的多示例学习算法,并对其进行了广泛的应用。现在,多示例学习已被广泛应用于数据挖掘、文本分类、图像检索、股票市场预测、垃圾邮件过滤等领域。多示例学习算法的研究是多示例学习问题和应用的核心,本文吸收MILD与MILIS方法的思想,提出了四种基于SVDD的自适应多示例学习算法:算法MILD-NSVDD_I与算法MILD-NSVDD_B,以及算法MILIS-NSVDD_I与算法MILIS-NSVDD_B。本文主要研究了以下三个方面的内容:首先,本文研究与总结了多示例学习与支持向量数据描述的研究现状。简要阐述了多示例学习问题与支持向量数据描述方法的相关背景,综述了多示例学习相关理论、多示例学习与传统机器学习的区别、几个多示例学习的经典算法与相关应用、多示例学习的扩展问题、统计学习理论与支持向量机理论等,研究了硬间隔单分类、软间隔单分类与带负类二分类三种支持向量数据描述方法等内容。其次,本文深入研究了基于代表示例选择与SVDD的多示例学习方法。探讨了正负包中代表示例选择方法、基于示例级的特征映射与基于包级的特征映射方法,研究并提出了将代表示例更新与分类器训练交替迭代进行的迭代学习框架,研究了基于SVDD的两种典型多示例学习算法mi-NSVDD与MI-NSVDD,提出了基于示例分类的MILD-NSVDD_I算法与基于包分类的MILD-NSVDD_B算法、基于示例分类的MILIS-NSVDD_I算法与基于包分类的MILIS-NSVDD_B算法。最后,本文在PC机上设计了两个数值实验,通过在多示例学习的基准测试数据集MUSK与基于内容检索的COREL图像库上验证本文算法的有效性,对比并分析了本文提出的算法与其他多示例学习算法在这两个实验中的分类性能,并直观的从物理意义上分析了基于示例级特征映射的分类算法与基于包级特征映射的分类算法之间性能差异的原因。综上所述,本文提出的算法MILD-NSVDD_I与算法MILD-NSVDD_B、以及算法MILIS-NSVDD_I与算法MILIS-NSVDD_B在解决多示例学习问题上是可行的,具有一定的理论与实际应用意义。
其他文献
德国Wille教授于1982年首次提出了形式概念分析理论,它是一种能够从形式背景中进行数据分析和规则提取的工具。对于形式概念分析理论,现有的研究主要集中在形式背景知识的获
WSN的应用中,无论是硬件设计还是软件层面,都将节省能量放在研究工作的第一位。路由机制作为WSN的关键技术,必须将降低能量开销和延长网络生存期放在设计工作的首位。本文选取PE
相似字符串查找在现实生活中的应用非常广泛,例如相似网页检测、数据清洗、电商网站的推荐功能、蛋白质功能预测等。相似字符串查找多是用一个给定的相似性函数来判断两个字
模式分类是数据挖掘的一个重要研究分支,其任务是根据给定的特征集与类标集训练一个数学函数,该函数也被称为分类器,以便对新出现的对象进行类别预测。自上世纪六七十年代以
学位
虚拟化技术的出现改变了管理计算机操作系统、存储以及应用程序的方式,它提供了共享物理资源的能力,使得物理资源能够在同一时间内被多个不同的虚拟机使用,消除了操作系统对物理
随着我国科技计划项目申报数量和经费的逐年递增,项目重复申报现象日益突出,人工形式审查难以有效解决项目查重问题。论文针对科技项目申请书的特征,主要研究项目申请书关键词提
温室控制技术正在不断突破,智能温室已成为温室控制新的发展阶段,在设施农业方面智能温室具有十分显著的典型性和代表性。本文在查阅了大量国内外温室控制材料基础上,首先对
随着现代信息技术的迅猛发展,计算机技术在各行各业中的应用日益广泛和深入,使计算机管理变得特别流行和重要。随着教育部一系列关于精品课程建设重要文件的下发,全国各高校
近年来,目标跟踪在计算机视觉领域扮演着非常重要的角色,同时也是其研究热点。随着目标跟踪技术的不断发展,它在各种各样实际的应用中都发挥着至关重要的作用。因此,各种目标