【摘 要】
:
随着大数据时代的来临,以及人们对图像、视频等多媒体数据质量的要求越来越高,数据的产生也与日俱增。这使得数据的存储和传输变得日益艰难。压缩感知技术是解决该问题的一种方法。它以其独特的混叠采样方式直接存储压缩后的混叠信号,将混叠信号直接传送到接收端,并通过设计的重构算法精确还原场景信号。这种方式有效地缓解了存储和传输的压力。得益于压缩感知技术的有效性,它已经被广泛用于医学成像、高速摄影、遥感探测等多个
论文部分内容阅读
随着大数据时代的来临,以及人们对图像、视频等多媒体数据质量的要求越来越高,数据的产生也与日俱增。这使得数据的存储和传输变得日益艰难。压缩感知技术是解决该问题的一种方法。它以其独特的混叠采样方式直接存储压缩后的混叠信号,将混叠信号直接传送到接收端,并通过设计的重构算法精确还原场景信号。这种方式有效地缓解了存储和传输的压力。得益于压缩感知技术的有效性,它已经被广泛用于医学成像、高速摄影、遥感探测等多个领域。现有的压缩感知算法主要分类两类:模型驱动的算法和数据驱动的算法。模型驱动的算法主要通过场景的先验知识,设计观测矩阵和对应的参数模型,并通过优化求解的方式得到重构信号。数据驱动的算法,大多是基于深度学习网络,其特点是需要大量的数据训练出观测矩阵以及对应的重构算法。模型驱动的方法由于需要优化求解,具有很高的时间复杂度,很难应用在实际中。相对于模型驱动的方法,数据驱动的算法在时间复杂度较低的情况下,能够达到较好的重构效果。本文主要针对数据驱动算法中存在的若干问题展开研究。首先,现有的基于深度学习的数据驱动算法,虽然在重构速度与效果上取得了较好的效果,但由于深度网络模型本身具有“黑盒子”特性,导致现有算法对网络内部的探究较少。换句话说,就是对算法本身的工作机理剖析不够。因此,亟需对算法的原理进行研究并具象的可视化出来;其次,大多数压缩感知算法对静态场景进行观测采样时,不区别场景中的主次,“眉毛胡子一把抓”。这样的采样方式和人类的视觉系统存在明显的差异,人类在观察场景时,会本能的区分场景中的感兴趣区域及非感兴趣区域,并对感兴趣区域过多的关注。因此,仿照人类视觉体系的压缩感知算法有待开发;最后,相对于静态场景,动态场景尤为重要。现有的针对动态场景的观测采样方式与重构算法,一般仅在时间或空间维度上进行,这样导致非压缩维度的冗余性较大。因此,针对时空维度的压缩感知采样及重构算法有待提出。针对上述存在的问题,我们展开研究,并提出相应的解决方案。本文的主要工作和创新点包括以下三个方面:1、提出一种基于深度残差模块的压缩感知网络,并以该网络为例,进一步剖析压缩感知网络的工作机理。这也是首个对基于深度学习的压缩感知网络进行理解和可视化的工作。具体的,对学习的观测矩阵进行可视化,并从时、频域对其分析。接着,从空间和系统的角度分析了网络的重构过程。然后,通过探究性实验进一步探索深度残差模块在网络中起到的作用。最后与现有方法进行对比,证明了所提算法的优越性。2、提出了一种基于感兴趣区域(ROI,Region of Interest)的压缩感知网络—ROI-CSNet。该网络可以在保证非ROI区域重构质量的前提下,对ROI区域的重构质量进一步提升。首先,这是利用深度卷积神经网络实现ROI感知(ROI-aware)图像重构的第一项工作。与基于均匀采样的传统压缩感知方法相比,该方法可以实时获取更高质量的ROI-aware图像。其次,提出两次观测的思路,并将两次观测得到的观测值融合在一起重构,一次性得到ROI-aware图像;并且将两次观测重构过程联合训练,从而使得两个观测矩阵能够捕获场景中的互补信息。最后,为了提高ROI-aware图像的重构质量,我们设计了ROI-aware损失函数,使网络在训练与测试时均能更加关注图像的ROI区域。3、提出基于时空观测与重构的混合3D视频压缩感知网络框架。该框架由观测部分和重构部分组成。在观测部分,通过数学表达描述了学习的时空观测矩阵的工作过程。在重构部分,设计了由混合3D残差模块组成的重构网络。该模块可以在表征视频时空特征的情况下,使网络的层数加深、参数减少。同时,通过一系列实验探究了该混合3D残差模块的构成与卷积核大小的选择。最后在公共数据集上,与其他方法对比,验证了所提方法在重构性能和重构速度上均达到了较高的水平。
其他文献
最近几十年,多智能体系统的协同控制在生物、工业、经济等不同领域有着广泛的应用。因此,作为协同问题的典型问题之一,一致性受到了大量的关注。所谓一致性,是指所有智能体通过与邻居共享信息达到一个相同的状态。一般地,处理多智能体系统的一致性问题时,常采用连续时间通信的方式,即智能体之间持续不断地传递信息。显然,这种方式是不现实的。由于传统的模拟控制器被数字控制器取代,智能体离散地广播信息,所以采样机制被引
复杂网络是一门涵盖计算数学、物理、计算机、生物等领域的交叉学科。复杂网络理论及方法能帮助人类分析大规模系统的组成结构、分析网络成员的运行动态并掌握功能结构的分布规律,在近年来的研究中得到了广泛的关注。结构各异的系统承担着不同的任务,也面临着复杂多变的应用环境,自然灾害或人为破坏等各种外界因素难免对于系统的正常运转造成干扰。在这一背景下,实际应用中需要的是性能鲁棒的网络,这样的网络在遭受一定的攻击或
自1929年英国生物学家弗莱明发现青霉素至今,人类已不断研发出多种抗生素。目前也已开展了各种抗生素在临床上得应用,越来越多的感染患者得到治愈,同时也伴随着越来越多的病原菌对各类抗生素产生了强大的耐药性。这其中以耐甲氧西林金黄色葡萄球菌(Methicillin-resistant Staphylococcus aureus,MRSA)为代表的多重耐药菌严重影响人类及其它生物健康。发现并研究新型药物以
移动互联网的迅猛发展使得人们生活中的图像数量激增,如何更好的管理和利用这些图像成为一个重要问题。由于图像特征提取作为图像处理任务中的一个关键步骤能够从冗余的图像信息中提取作为判别与分析标准的主要特性,因此从图像中提取特征以挖掘并利用图像数据蕴含的重要信息是解决这个问题的有效方法。此外,为了解决其存储和计算负担,人们更愿意将大量图像存储到远程云服务器。然而,在享受便利的同时,将包含大量敏感信息的图像
图像作为一种包含大量信息的多媒体数据,在人们生活和工作中扮演着越来越重要的角色。图像分割是图像识别和计算机视觉至关重要的预处理步骤,也是实现图像理解的一种有效途径,作为图像处理的重要环节受到了越来越多的关注。图像分割在计算机视觉、人脸识别、产品检测、工业自动化、智能交通、文字识别、外星探测、航空与航天技术、遥感卫星图像处理、生物与医学工程、体育和农业等领域得到了广泛的应用。在很多工程应用中,由于实
随着互联网技术的普及和定位技术的不断发展,越来越多的轨迹数据在连续不断地产生。这些轨迹数据蕴含着丰富的信息,能够用于许多城市应用,例如:违章停车检测、车流分析预测、空气质量分析以及可达区域分析等。为充分利用这些轨迹数据,我们首先需要对这些轨迹数据进行有效的管理。然而,由于轨迹数据量通常非常大、更新频率很高、内在结构复杂、查询模式独特,要高效管理轨迹数据非常困难。传统的关系型数据库,例如My SQL
图像分割是连接低、高层次计算机视觉的图像处理的重要任务。图像分割是将图像分割成若干独特的子区域,使之成为图像处理应用程序的预处理步骤。由于图像的特征伪影(例如低对比度、噪声和强度变化或不均匀性),图像分割仍然是最需要解决的问题。主动轮廓模型(Active Contour Model,ACM)是图像分割中用于目标检测的一种基于能量的方法。本论文中,我们设计了四个主动轮廓模型来分割不同类型的图像,这些
装配是生产制造业中的主要活动,耗费了大量的人力与物力。产品装配性能对产品质量、产品的生产效率和成本均具有重要影响。利用虚拟装配技术可以在计算机中建立起逼真的装配环境,对实际装配活动进行仿真,并在此基础上对产品的可装配性、装配工艺的合理性、装配操作的舒适性进行分析验证,从而在产品研发的早期阶段及时发现产品设计和工艺规划中的问题与缺陷,减少设计变更,缩短产品研发周期,提高产品装配效率与质量。目前虚拟装
近年来,在互联网、商业服务、工程应用、科学研究等领域产生了大量的数据,这些数据正以指数级速度增长。矩阵是数据表示的经典形式,大数据就产生了大型矩阵,大型矩阵的存储和计算都是非常具有挑战性的工作。但幸运的是,在实际应用中许多高维数据通常位于低维流形中,所以我们可以用低秩的矩阵近似大规模矩阵。低秩矩阵逼近在计算数学,统计学,基因组学,文本处理,社交网络,机器学习等领域应用广泛。低秩矩阵求解模型一般是一
恶性肿瘤疾病如今已在全球范围内,成为对人类健康最严重的威胁之一。统计数据显示,中国每日确诊的癌症患者超过一万人。实现对肿瘤的精确检测与治疗,对于人类共同对抗肿瘤疾病而言有着重要的意义和积极的作用。但是因为肿瘤疾病在发生发展过程中的复杂性极高,肿瘤诊疗精度的提升面临着严峻的挑战。近年来广受关注的契伦科夫光学分子成像(Cherenkov luminescence imaging,CLI)为肿瘤精准诊疗