多媒体数据分析的多视图流形表示研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:sunjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域中普遍面临处理大量且高维的多媒体数据问题。并且,如何从具有多样性和非线性的多媒体数据中提取有效的鉴别性特征,是特征提取算法中具有挑战性的课题。本文对以上问题进行了研究,其核心思想是利用高维数据在实际应用中往往具有低维的特点,将数据的几何结构表示为流形图结构并进行分析。论文具体介绍了三种新的多媒体数据分析方法,并取得了显著的进展。其中包括引入了多流形嵌入的字典诱导最小二乘框架,引入了图嵌入的广义多字典最小二乘框架,以及通过保持PCA框架的全局和局部结构进行流形对齐。
  第一种方法扩展了主成分分析(PCA)的概念,通过最小化最小二乘重构误差思想保持数据全局结构,并引入分布字典对丢失和噪声数据点的离群分布对数据结构重构。接着,通过多流形嵌入保持纯净的局部结构。因此,这种方法可以在低维投影中获得鉴别信息,同时保持全局和局部结构的平衡。我们提出的方法在多媒体数据分析方面进行了大量实验并与目前最先进方法相比表明该方法具有更好的性能。
  进一步的,在此基础上对第一种方法进行扩展,我们提出使用包含多个字典的第二种方法。在多视图数据的情况下,多字典进一步增强了对噪声和冗余数据点的识别。接着,根据两种对多个词典的不同的约束条件构造,扩展出两种具有闭式解的新方法。实验结果表明,所提出的方法比对比方法有所提高,其统计显著性低于0.05显著性水平。
  最后,我们提出了一个流形对齐框架,它可以跨实例和跨特征进行流形对齐,同时保持多数据的全局和局部域结构。我们通过多种流形嵌入方法来保持局部结构。此外,我们提出了一种字典PCA方法进行去噪,保持数据的全局结构,在此框架下,流形嵌入方法视为PCA的特殊形式。最后,给出了流形对齐问题闭式解。这种方法匹配了数据集间的对应关系并保留全局和局部结构,并在低维子空间投影表示。大量的实验证明,该方法的结果比对比算法取得了明显提升。
其他文献
在线教育市场整体规模:成人教育依然占据市场主体,K12教育成必争之地2019年中国在线教育市场规模突破3200亿元,其中74.6%为高等教育和职业培训,21.3%为K12教育。在线教育市场流量情况:月独立设备总数增速平缓,但用户使用时长增速强劲整体流量:中国在线教育APP月独立设备总数持续增长,截止到2019年12月达4.4亿台。流量增速:月独立设备总数同比增速为14%,而用户使用时长同比增速在4
会议
目的:回顾11例儿童心脏移植的适应症、排异反应监测和治疗的经验,报道用HT治疗儿童终末期心力衰竭的近期和中期存活率。方法:经优化的抗心力衰竭治疗6个月以上,心室功能仍进行性恶化的年龄在13~18岁的患者11例。术前心脏病诊断为原发性扩张型心肌病6例,致心律失常性右室心肌病2例,Becker型肌营养不良累及心肌1例,心室肥厚的扩张型心肌病1例,心肌致密化不全1例。排异反应的监测:除了严密的临床观察和
片上系统(SoC)作为一种传统的设计架构得到了广泛的应用,但是随着芯片集成度的增加,片上系统在时钟延迟和扩展性等方面逐渐显现出劣势。而由计算机网络模型发展而来片上网络(NoC)技术,因为其在扩展性、通信能力等方面具有更好的性能表现,所以作为多核互连的一种通讯方式具有广泛的应用前景。与此同时,随着单一芯片数据处理量成倍增长,芯片间海量数据实时传输需求也逐渐增大,故针对片上系统、片上网络这两类集成电路
学位
安全阀是现代工业和军事领域中十分重要的基本零件。在某型飞行器的控制装置上,安全阀的性能指标直接影响了飞行器的控制效果。本课题依托中国航天科工集团某公司的项目,在课题组前期的研究基础上,本文针对原方案的三个主要问题作了改进并完善了安全阀测试系统的相关研制与测试工作。  针对气路的电动调压执行器调压精度低,稳压效果差,被控气压存在震荡的问题。本文提出了新的气路电动调压机构设计方案,并对气路系统进行重新
人体脉搏信号是一种非常重要的生理信号,包含了大量反映人体健康状况的信息。中医学中通过脉诊的方式获取人体的脉搏信号,根据脉搏搏动的特点定义了不同的脉象信号。脉诊过程需要中医师用手指来感受人体桡动脉处的脉搏搏动,因而诊断结果受医师的主观意识和临床经验等因素的影响较大,且脉诊方法的掌握需经历长时间的学习和实践。因此,脉诊的客观化研究是中医脉诊发展急需解决的问题。本文针对脉诊客观化问题,从脉象信号的采集、
学位
高炉生产作为钢铁生产过程的上游工序,其能耗巨大约占钢铁工业的总能耗的70%,所以高炉冶炼是钢铁工业实现绿色发展的主要潜力所在。而高炉铁水硅含量作为衡量铁水质量的主要指标,同时与炉温成正相关,对其准确建模是实现高炉高效控制和实现节能减排的必要条件。因此,本文针对高炉铁水硅含量预测模型展开研究,并针对模型中一些关键参数无法确定的问题,提出一种改进的灰狼优化算法进行优化,建立了高炉铁水硅含量预测模型,其
学位
近年来,关于群体机器人系统的研究越来越受到关注。群体机器人系统的机器人数量规模和部分智能性对人与机器人之间的交互提出了新的交互需求,如何通过自然的方式实现与群体机器人系统之间的高效交互是人-群体机器人交互研究需要解决的问题之一。针对这一问题,本文提出了基于多通道的人-群体机器人自然交互技术及系统,通过三维手势交互通道和自然语言指令通道的协作和交互信息的互补,实现了人与群体机器人之间自然、高效的交互
随着深度摄像头与计算机工业的快速发展,许多行业都有对真实人体温度场模拟预测的应用需求:在影视特效行业,可以通过可视化真实人体温度场为现代媒介带来更加丰富的展示方式;在医疗行业,可以通过对比正常人体与患者的皮肤表面温度帮助医生做出判断;在机器人领域,真实人体的温度场可以帮助他们选择制造机器人的材料以更好地模拟正常人的温度。因此对真实人体的预测和可视化是一项非常有意义的工作。  过去的数值人体生物热模
学位
多种群粒子群优化算法(Multi-swarm particle swarm optimization,MPSO)将种群划分成若干个子群,子群内的各个粒子既独立寻优,又通过共享信息而协同搜索,是一种局部搜索与全局搜索相融合的优化算法。然而,它跟基本粒子群优化算法(PSO)相同,在搜索过程中速度越来越小,粒子可能会慢慢停滞,出现过早地收敛,最终陷入局部最优的状况。作为一种非线性现象,混沌本身具有一定规
第四代(4G)及未来通信系统包含多种无线接入标准,覆盖范围、网络可用性和用户体验质量(QoE)会随着用户设备(UE)的移动和速度而快速变化。无缝连接传输包含开发智能主动机制,目的是以便有效地预测和执行垂直切换(VHO)。考虑到用户设备移动模式的不确定性,使得挑战的复杂性大幅增加。诸如室内或室外环境等地理拓扑结构也会对网络覆盖范围和用户设备的移动施加进一步的限制。对于可见光通信(VLC)来说,另一个