基于判别字典学习的混合采样数据分类方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:kirk318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际生活中,广泛存在由不同采样频率采集的不同特征集合所形成的混合采样数据。这类数据不仅不同采样频率数据之间特征集合不同,而且其样本数量也不一致,传统的分类方法不能直接使用。本文认为,混合采样数据是不同视图数据以不同频率采集而成的多视图数据的一种特殊样式。因此,针对混合采样数据的分类问题,本文基于判别成对字典学习方法,从多视图数据分析的角度进行了研究。针对如何解决因混合采样数据独特的数据特点而产生的问题,本文提出一种基于字典学习的混合采样数据分类方法。该方法通过类比混合采样数据与多视图数据的特点,以判别字典学习方法作为基础模型。此外,Fisher判别准则被用来约束编码系数矩阵的列向量间的关系,使得其类内散度越小,类间散度越大,从而保证了编码系数矩阵的判别性。最后在分类阶段,本文采用对对应采样频率的数据进行编码重构的方法,进而判断样本所属类簇。针对进一步提升学习字典的判别性,从而提升模型的分类性能问题,论文将上述方法进行改进提出了一种基于局部秩序信息约束的混合采样数据成对字典学习分类方法。该方法利用基于综合字典和解析字典相结合的方法,不仅改善了传统0L范数或1L范数约束带来的训练测试代价问题,学习的结构化成对字典还可以巧妙应对混合采样数据采样频率不一致的特点。学习的综合字典保证样本能更好地被重构,而解析字典使得能直接由原始数据得到样本的近似编码系数矩阵,并引入局部秩序信息保留策略以增强成对字典的判别性。本文在Sens IT、Digit和Web KB等8个真实数据集上对本文所提方法进行了实验,结果表明,在大多数情况下,本文所提方法在指标ACC和F1-score上与表现最好的对比方法结果相当或优于对比方法1到2个百分点。进一步说明了在某些场景下采用填充手段处理混合采样数据是不可取之举,从而验证了提出方法的有效性。
其他文献
预测推理是机器人模仿人类智能的一项重要能力。近年来计算机视觉领域中的视频预测技术为机器人提供了预测编码的实现手段,使得机器人可以根据少量连续的视频等信息通过图像
数字全息(Digital Holographic,DH)数值重建距离与全息图的记录距离有关[1],由于像差复杂、衍射极限、记录仪器(CCD、CMOS传感器、SLM空间光调制器)分辨率限制以及一些人为实验损
随着计算机视觉技术的快速发展,人脸表情识别技术逐渐兴起。无论在学术界还是应用在工业界,如何实现人脸表情的自动识别已经成为研究的热门课题。当前人脸表情识别技术存在巨
2018年9月26日,第四届中国(国际)商业航天高峰论坛在武汉举行。论坛以“引领商业航天,纵览产业发展”为主题。本次实践报告以这次论坛为材料,运用吉尔的精力分配模型来指导整个汉译英交替传译口译实践过程,与此同时,口译员采用罗赞总结出的口译笔记的七个原则对具体过程进行分析并进行译后的总结与反思。在口译实践中,译员遇到了大量的专业领域词汇以及部分医学类词汇,另外,由于信息量庞大,做笔记需要花费一定的时
有关报告显示,近年来我国的老龄化程度越来越高,同时全国的残疾人群也非常庞大。对于部分存在运动障碍的老年人或残疾人士而言,传统的假肢或轮椅等设备并不能够实现他们自主
基于视觉的非完整轮式移动机器人在工业、军事和商业等生产活动中扮演着越来越重要的角色,其中轨迹跟踪问题是非完整轮式移动机器人的重要研究内容。非完整系统的轨迹跟踪时
DMB(Digital Multimedia Broadcasting,数字多媒体广播)同频直放站作为一种无线中继放大器,可以提高DMB信号的覆盖范围,减少盲区。但由于同频转发特性,同频直放站收发天线之
随着传感器和信息技术的快速发展,大量高维数据的快速获取也越来越便捷。然而,这些原始的高维数据在收集、存储和传输的过程中往往不可避免地会受到一些因素的干扰而丢失部分
在当前的大数据时代,各个领域每分每秒都在产生大量的信息,这些数据需要及时地通过网络传输到指定数据中心进行分析,随着数据量的增加和不断提高的服务质量(Quality of Servi
镧系荧光配位材料因其多样的结构和优异的光学性能一直以来受到诸多研究者的青睐,并被广泛的应用于材料科学,生物医学等领域。镧系配合物中具有“天线效应”的配体吸收紫外光