基于深度变换卷积神经网络的多聚焦图像融合

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:hwwacm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像作为最简洁和最具表现力的视觉语言,在当前这个信息时代占据着举足轻重的作用。由于成像设备的不完备以及拍摄技术的不成熟,导致获取的图像所表达的信息不清晰,难以满足现实需求。而解决图像质量的一种常用手段是多聚焦图像融合。多聚焦图像融合作为一种提升图像质量的有效方法,通过手工设计的融合规则将同一场景下多幅不同焦距的图像融合成一幅全清晰的图像。现有的方法根据使用的技术被划分为:基于传统的方法和基于深度学习的方法。基于传统的方法存在的问题是融合图像质量相对较低,而基于深度学习的方法存在的问题是融合速率较慢。为了解决现有方法存在的问题,本论文针对融合质量和融合速率进行如下研究:1.针对融合速率和融合质量不能兼顾问题,提出基于离散切比雪夫矩深度神经网络的多聚焦图像融合方法。该方法的网络模型仅包含四个卷积层。第一个卷积层的参数由离散切比雪夫矩系数固定,有效提取图像的低频特征。后三个卷积层用于低频特征分类,替代传统方法中的聚焦度量。因此,该方法兼顾了融合质量和融合速率。在多个数据集上验证了本文提出的方法参数较少(0.01M的参数量vs.常规卷积神经网络的4.93M参数量),能快速生成融合图像(0.32s vs.常规卷积神经网络的79.09s融合速率)。2.针对上一个方法存在的缺陷以及新发现的同质区域难区分问题,提出基于对比学习的多聚焦图像融合方法。基于分类的多聚焦图像方法在源图像的同质区域容易出现误分类,极大的降低了融合质量。因此,在输入层次,仍然使用低阶的离散切比雪夫矩固定卷积提取图像的低频信息。然后将低频信息送入一个大尺度阶数融合卷积对提取的不同阶特征进行融合,一方面增强同类特征的相关性,另一方面拉大异类特征的差异。最后,将融合后的特征输入全连接层进行聚焦度量,并输出决策图用于融合。此外,在训练过程中,对比学习损失被设计用于监督融合卷积,增强其对聚焦像素和离焦像素的辨别能力。在多个数据集上验证了所提出的方法性能更优,且无后处理。
其他文献
煤炭是我国主要的能源之一,保障煤矿的安全生产是煤炭行业的主要目标之一。矿井下的传送带区域是煤矿生产的一个危险区域,时常有工人违规操作,极易导致安全事故的发生。由于煤矿环境的特殊性,目前煤矿下视频监控技术的发展并不成熟,不能对传送带区域容易发生的违章行为和事故进行管控。因此,本文针对煤矿井下传送带区域内人员和传送带的状态监测的现存问题进行研究,提出了一种基于此场景监控视频的协同分析方法,并利用该方法
学位
作为一种自然界中资源最丰富的天然高分子材料,植物纤维由于其价格低廉、可再生、可降解等优点以及对水泥产品良好的力学性能提升效果,被认为是建筑材料中传统纤维的有效替代产品之一。然而,植物纤维在水泥孔隙溶液碱性环境下的劣化行为在很大程度上制约了植物纤维在水泥基材料中的广泛应用。因此,研究植物纤维在水泥孔隙溶液中的劣化行为并开发有效的耐久性调控技术具有重要意义。鉴于此,本文采用模拟的简化水泥孔隙溶液与真实
学位
报纸
随着我国电商行业的发展,各大电商平台需要更加个性化、智能化的方法提升平台的收益以及用户的购物体验。对用户的消费偏好的研究可以准确预测电商平台广告点击率,从而有效实现精准营销和个性化推荐。本文从电商平台用户历史行为序列和商品特征属性两个方面出发,深入电商平台用户、商品特征隐藏的用户兴趣研究。本文贡献总结如下:1.基于用户行为序列特征层面,针对传统循环神经网络处理时序数据的优势但忽略输入序列时间间隔的
学位
社交媒体是互联网飞速发展的产物之一,民众通过社交媒体交流信息已变成日常生活中必不可少的一件事情。微博作为热门的社交媒体之一,其特点是使用方式简单便捷、实时性高以及传播迅速,并因这些特点成为了国内民众表达情感和分享日常的重要渠道。微博拥有十分庞大的用户群体,每天都能产生海量含有民众情感的微博文本,微博文本成为了国内舆论走向的代表之一,因此对微博文本进行情感分类研究,可以挖掘出微博文本中的情感信息应用
学位
不平衡分类问题一直是机器学习、模式识别和数据挖掘领域的研究热点。目前分类器大多都是基于平衡数据集进行设计的,因此对不平衡数据集,其分类结果往往偏向多数类,降低了模型的泛化性能。面对现实生活中大量的不平衡数据集,如何从中学习到拟合能力较强的模型具有十分重要的现实意义与应用价值。目前,有许多采样和代价敏感学习等方法可以减少不平衡数据对分类性能的负面影响,其中采样中的过采样方法是最常用的一种数据预处理方
学位
唇语识别的目的在于利用视觉信息弥补听觉通道的不足,广泛应用于监控视频语音还原、噪声环境语音增强等领域。唇语识别的挑战体现在其涉及两种感知通道的转换,唇语本身具有多义性、多样性,以及唇部细节视觉特征的表示与理解,也是导致现有的唇语识别技术仍面临着流畅度不高、可懂度低等问题的原因。改善这一问题的关键在于如何获取更丰富的唇部变化的细节信息并挖掘其时空相关性。为此,本文从注意力机制和多分支时间卷积网络两个
学位
报纸
建设造福人民的幸福河湖是新时期河湖治理的目标,构建幸福河湖评价指标体系是检验河湖治理成效的重要手段,河湖水生物评价指标是幸福河湖评价指标体系的关键内容。以某省幸福河湖评价办法为例,笔者从幸福河湖评价体系总框架、水生物评价指标选取、涵义及测算方法等方面进行了探讨研究,分析了幸福河湖水生物评价指标的代表性、监测与评价标准的统一性、调查结果的准确性及评价结论的可靠性,以及水生物评价指标体系构建面临的问题
期刊
目的 基于标化表观扩散系数(ADC)值预测膀胱癌患者人表皮生长因子受体2(HER2)的表达状态。方法 回顾性研究127例膀胱尿路上皮癌患者的术前盆腔3.0T核磁共振(MRI)扫描图像,计算标化ADC值。采用免疫组织化学法(IHC)检测术后组织标本中的HER2表达状态。在HER2各表达水平间、不同表达状态划分间比较标化ADC值的差异。标化ADC值与HER2表达状态行相关性分析。受试者工作曲线(ROC
期刊