基于支持向量机的多示例学习研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yuany06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学技术的发展促进了大数据时代的产生,使得数据已经日渐成为推动当今所有行业和业务职能领域发展的重要资源.如何从指数式增长的数据中挖掘出潜在的、有价值的信息已经成为社会普遍关注的问题.多示例学习是指训练集中的每个数据样本(包)包含了多个示例,且只有包具有完整的标签信息,示例的标签信息并不完整.然而在一些多示例学习的实际应用中,除了对于示例间相关性缺少有效的衡量标准之外,多示例学习中还存在着不平衡的问题,即多示例数据集并非均匀分布.因此,本文基于以上存在的两点问题对多示例学习进行深入研究,主要工作如下:基于示例特征和示例相关性,本文提出了基于灰色关联分析的具有多代表包多示例学习算法(MIMBR).对数据集中每个包,它通过灰色关联分析对包中示例进行整合,同时对包中示例的重要性做出初步判断.为了简化决策函数,减少决策函数的计算复杂度,本文根据支持向量机训练一种基于包级信息的更新分类器的两步迭代优化框架.为了扩大该算法的广泛应用性,本文还将二分类多示例学习算法推广到多分类任务中.为了验证算法的有效性,本文在10个数据集上评估了MIMBR算法与9个最先进的多示例方法的性能,结果证实MIMBR算法有着较好的分类性能.考虑到如何更好地改善类不平衡的问题,本文提出了一种改进多示例学习中正类表示的方法,它可以有效地集成正包中示例信息以构建分类模型或分类器.在多示例学习中,不同数据集中的示例分布是不同的,核密度估计可以从侧面反映出负类示例的总体分布.算法根据示例分布情况,对负包中每个示例按照近邻中正示例的数量降序排列赋予权重,以确保可以把正包中示例尽可能的分类正确.实验结果表明,将处理后的正包示例和按权选取的负包示例作为新的数据集后能够有效解决多示例学习中存在的类不平衡问题.本文提出了两种基于示例特征和相关性的多示例学习算法,且它们的有效性经过一系列理论分析和实验验证得到了充分的证明.最后对所做的主要工作和创新点进行简要总结,并对之后的下一步研究做出展望和规划.
其他文献
2014年我国新颁布的CAS41中提出了结构化主体这一概念,并将其定义为“在确定其控制方时没有将表决权或类似权利作为决定因素而设计的主体”。目前国内对于结构化主体的研究还比较少,本文研究了上市公司结构化主体的设立与并表情况,并试图分析其中原因。本文选取我国沪深两市A股上市公司2014-2018年的数据为样本,实证结果表明:企业在设立结构化主体的动因包括企业财务报告披露、避税以及融资需求这三个动因,
雷达辐射源个体识别(Radar Emitter Individual Identification)是现代电子侦察系统中的关键技术,旨在根据附加在信号上的反映个体差异的指纹特征,识别发射该信号的特定雷达辐射源个体。随着电磁环境日益复杂以及电子侦察技术智能化、自动化水平的升级,雷达辐射源信号波形变化复杂、参数多变快变、特征更加隐蔽,给雷达辐射源个体识别带来了新的困难与挑战。本文以雷达辐射源个体识别中
近年来,随着智能终端设备的普及,移动视频业务推动着移动数据流量呈现爆炸式增长,同时催生出大量计算密集型和时延敏感型应用。这些不断涌现的应用在丰富和便利人们生活的同时,也给移动网络基础设施提出了严峻的挑战。为了解决这一问题,5G移动通信网络在边缘结点引入存储和计算资源,通过内容缓存及任务卸载来降低回传链路压力,保证传输时延,满足终端计算和流量需求,从而给用户带来更加优质的移动服务。移动边缘计算也被认
随着我国电网规模的飞速发展,并且在大幅度提高消纳新能源发电能力的大环境下,电力系统的稳定性成为了一个电力系统控制的突出问题。电力系统的低频振荡是一种典型的对电力系统稳定的扰动,在抑制低频振荡一次系统和二次系统方面的众多对策中,电力系统稳定器(PSS)是最常用,也是控制效果较好的策略之一。近年来,在PSS的设计中引入了诸多的先进算法。其中,预测控制(MPC)由于其本身的在线滚动优化、反馈校正、模型预
为深入贯彻落实党的十九大提出的“食品安全战略”,让人民吃得放心,按照《上海市2018年无证无照食品经营治理工作方案》的要求,完成至2018年底上海市基本消除无证无照食品经营的目标,2018年4月6日,崇明区印发《2018年崇明无证无照食品经营治理工作方案》,通过组建违法违规经营综合治理领导小组,以市场监管局为主导,联合城管执法、公安、网格化管理中心等24个部门,采取备案纳管、疏导办证、消防安全、人
改革开放以来,我国经济实现了高速增长,国民经济的发展促使能源需求不断增加。为满足经济发展对能源的需求,国家大力支持资源型产业的发展。山西省作为典型的资源型省份,长期将发展煤炭产业作为本省的发展战略核心,在实现自身经济发展的同时也为我国经济发展贡献了不可磨灭的力量。但随着国际国内煤炭市场需求饱和、煤炭价格下跌、经济形势下滑,原本火热的煤炭市场瞬间进入寒冬期,山西经济受到严重冲击。传统煤炭资源型地区的
“三农”问题一直以来是我国工作的重点内容,而完善农村公共服务设施建设是促进城乡统筹发展、建设美丽乡村的必然要求,随着一系列利民惠农政策的实施,我国农村公共服务设施建设已取得了一定成效,但仍存在不完善之处和明显的短板问题。2020年发布的中央一号文件指出,要对标全面建成小康社会,加快补上农村基础设施和公共服务短板,这表明农村公共服务设施建设还需要进一步巩固和提高。本文通过研究讷河市农村公共服务设施建
近年来,无线传感器网络发展迅速,软件定义无线传感网络中加入了集中控制的思想,改善了无线传感网络传感节点功能简单、计算和存储能力较差的缺陷。但无线传感网络的能耗问题在软件定义架构下依旧存在。为进一步改善软件定义无线传感网络中的能耗问题,本文研究了网络编码技术,基于流间和流内的网络编码方式,提出了两种适用于SDWSN的能效算法,并设计搭建了适用的SDWSN的系统。两种算法的设计分别针对于不同的应用场景
随着物联网技术的不断发展,家居设备的智能化控制成为了当前重要的研究内容。但是由于各种智能家居设备的控制管理相对独立,以及不同厂家设备产品智能化管理的不统一,要想实现对智能家居设备的管理就需要应用多种智能终端控制。为了能够更好的推进智能家居生活,论文从实际应用出发,为智能家居生活推出了一款可以进行无线控制的管理系统,可以很好地实现生活中各种智能设备与控制软件系统的通信,为智能化生活提供有效支持。首先
本文利用反散射变换方法研究了扰动sine-Gordon方程.通过对可积sine-Gordon方程添加小的扰动项,得到散射数据的最低阶渐近形式的扰动演化方程.如果让小扰动项为零,则上述结果可约化为可积sine-Gordon方程的经典结果.通过上述计算,我们给出了扰动sine-Gordon方程的渐近解.这个渐近解可分为两部分,一部分是绝热近似解,而另一部分是与绝热近似解相关的ε-级近似解.