基于深度学习的分数像素运动补偿方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:liongliong571
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信技术、大数据以及多媒体技术的发展,多媒体应用已在人们的生活中扮演着越来越重要的角色。移动终端的普及以及视频分辨率的增长使得互联网上传输的视频数据量呈迅猛增长态势,给视频编码带来了前所未有的挑战。近年来,以深度学习为代表的人工智能技术在图像处理、计算机视觉以及自然语言理解等领域取得了巨大的突破。深度神经网络具有强大的非线性表达能力,可以进行端到端训练的方式实现联合优化。如何将深度学习技术与视频编码结合起来,利用深度学习进一步提升视频编码的性能是一个具有价值的课题。
  现有的视频编码标准中采用基于运动补偿的帧间预测技术来去除时间冗余,从而降低待编码块的编码码率。由于数字采样的缘故,物体的实际运动往往无法与采样网格对齐,因此难以在参考帧中找到精确的匹配块。为了解决这个问题,视频编码中引入了分像素运动补偿的概念,通过插值滤波器从整像素图像插值得到分像素图像,利用得到的分像素图像进行运动补偿。传统的分像素运动补偿一般是使用简单的有限冲激响应滤波器,固定的线性滤波器实现简单复杂度低,但是难以处理视频信号中普遍的非线性和非平稳性,编码效率有待提高。本文主要研究如何利用深度学习技术学习更加高效的插值滤波器,从而提高分像素运动补偿的编码性能。
  本文的主要的创新点和贡献如下:
  1.本文提出了首个基于卷积神经网络的分像素插值技术。卷积神经网络的有监督训练需要预先确定网络的输入和目标输出,即本文中的整数图像和分数图像。但是由于分数图像在数字采样时并未获取,因此无法获得训练所需的训练数据。针对分像素样本无法获取的问题,本文首先分析了数字图像的成像原理,提出了基于高斯低通滤波和多相抽样的分像素样本生成算法。此外,由于一般视频编码中采用的是有损编码,参考帧中存在编码噪声。为了处理参考帧存在的编码噪声,本文提出基于量化参数的训练数据产生方法。最后,本文进一步提出利用卷积神经网络训练得到更加高效的插值滤波器。本文的结果证实了基于深度学习的分像素插值技术的有效性。
  2.本文提出了基于帧间回归模型的的分像素运动补偿方法。从率失真优化的角度看,分像素运动补偿的目的是提高帧间预测的精度,因此本文将分像素运动补偿定义为帧间回归问题,即将参考图像的整像素样本映射为当前待编码图像样本的映射过程。本文进一步设计了基于卷积神经网络的学习算法求解上述帧间回归问题。HEVC中采用了双向预测技术,采用两个预测块的平均值作为当前编码块的预测。针对双向预测问题,本文提出了一般化的分像素插值模型,将双向预测的分像素插值看作是二元回归模型,即将两个方向的整像素参考块映射为当前待编码块。为了求解双向预测中的分像素插值问题,本文设计了迭代求解算法,将二元回归模型转化为两个一元回归模型。此外,本文提出了基于视频序列的分像素插值模型的训练数据产生方法。本文进一步研究了如何更加灵活高效地将训练得到的插值模型集成到HEVC参考软件中。实验结果显示,本文提出的基于卷积神经网络的分像素运动补偿方法可以显著提高帧间预测的编码性能。
  3.本文提出了基于可逆性的插值滤波器的训练方法。本文首先从整像素和分像素具有的空间位置的对偶性,揭示了分像素插值的可逆性,即理想的插值滤波器不仅能从整像素插值得到分像素,还可以从分像素插值得到整像素。本文进一步从信号处理的角度给出了可逆性的理论解释。利用可逆性,本文提出了插值滤波器的无监督训练算法,并设计了相应的端到端的训练框架。本文设计了两种损失函数来优化所提出的训练框架,包括可逆重建损失函数以及分像素正则损失函数。本文提出的基于可逆性的插值滤波器的训练方法不再需要手工设计的分像素样本作为标签数据,克服了之前基于学习的插值滤波器的缺点。
其他文献
摘要:学生之间的矛盾是细而杂的,作为班主任,要秉着一切为了学生的发展的理念,重视他们之间的矛盾,树立平等的学生观,营造充满爱的班级氛围,更要及时结合班干部的力量帮他们和平解决,让他们在矛盾中提升自己的心理素质,增强他们的沟通交际能力,提升班级的凝聚力,让他们在良好的班级中向全面健康成长迈向一大步。  关键词:班主任;同学矛盾;化解  初中学生的心身发展都在人生的初期,社会阅历尚浅,陪伴他们成长的大
期刊
摘要:“课程思政”是当前各高职院校教学改革的一个重要方向,各门课程应把思政教育放在课程教学的首位。本文分析了高职课程思政教育融入高等数学课程教学的意义,并对其有效途径与方法进行研究,使高职高等数学教育和思想政治教育相融合,实现知识传授与育人目标相统一,促进人才的全面发展。  关键词:高等数学,课程思政,立德树人  在2016年全国高校思想政治工作会议上的重要讲话中强调,要坚持把“立德树人”作为高校
期刊
摘要:互联网在当今社会逐渐普及,互联网+视域下高职院校学生管理工作成为了高职院校管理的新趋势。互联网+在各个教育阶层都发挥着重要作用,因此高职院校的管理者在对学生进行管理时,要与时俱进,积极结合互联网+的优势,采取合理和高效的管理策略。  关键词:互联网+;高职院校;管理;对策  在教育迅速发展的时代下,进入高等教育课堂的学生也越来越多。如何有效地顺应时代发展,加强对于高职院校的管理,是许多高校需
期刊
摘要:多年来,大学英语教学一直存在中国文化“失语”问题,学生用英文表达中国传统文化的能力较弱。基于“一带一路”时代大背景,从主观因素和客观因素分析大学英语教学存在“中国文化失语”的原因,并提出相应对策改善“失语”教学现状,培养大学生用英语传播中国文化的跨文化交际能力,带领中国文化“走出去”。  关键词:大学英语教学;“中国文化失语”;一带一路;跨文化交际  引言  “新丝绸之路经济带”和“21世纪
期刊
摘要:数学作为中职教育中的重点学科,其对培养学生的抽象思维能力具有一定的积极作用,对于中职学生而言,抽象思维是强化逻辑思维训练的重要组成部分,对其后续专业知识的学习大有裨益。为此,在中职数学学科教学中,必须重视对分层教学法的应用和探究,切实提升分层教学法应用的科学性与合理性。本文就中职数学学科分层教学现状和应用方法进行论述分析,以期促进中职数学教育的顺利开展。  关键词:中职数学;分层教学;现状;
期刊
摘要:当前高职院校金融课程教学过程中存在教学方式不够与时俱进,教学效率不高等问题,对于院校的自身发展以及学生的金融知识学习有极大的阻碍,需要及时采取合理措施对高职金融课程的教学进行改革,帮助提升金融课程教学的效率与质量,为高职院校的发展以及金融人才的培养提供更有利的条件。  关键词:高职院校;金融课程教学;教学改革;改革对策  引言  高职院校的办学理念是培养更具职业素养的专业向人才,相较于一般的
期刊
摘要:我国经济建设最近几年发展非常迅速,加速我国各行业的发进程,为我国基础建设的不断完善贡献力量。随着我国传统文化及艺术形式不断创新,民间美术作为一种民族艺术形式,在传承与发展中遇到瓶颈。如何将民间美术形式进行有效传承一直备受诸多学者关注。通过近年来研究发现,将民间美术形式融入现代艺术设计中有利于对其发展传承。  关键词:现代艺术设计;民间美术;结合  引言  我国上下五千年,有着非常悠久的历史,
期刊
摘要:从现阶段高职院校教育工作开展实际情况来看,就业指导已经成为了现阶段高等院校最为重要的课程之一,在实际展开教育的过程中,应该注意结合高校思想政治教育特点,保证其与现阶段大学生自身实际接受能力相符合。对大学生进行思想政治教育是促进其学习以及就业的重要方式,基于此,本文也尝试对大学生思想政治教育与就业指导相融合的路径进行了分析。  关键词:大学生;思想政治教育;就业指导;融合路径  在现阶段的形势
期刊
摘要:2019年为响应全国号召,石河子大学医学院积极开展了大规模网络教学,让学生在家中也不落下学校的课程学习,为祖国新生代的力量添砖加瓦。同时本着学有所思,思有所进,进有所改的态度,石河子大学医学院在这次开展的大规模网络教学任务中,积累了一些关于线上教学的授课方法以及教学经验。同时石河子大学医学院的《医学影像诊断学》课程,采用以慕课为基础的线上教学模式,并取得了一定的成果。  关键词:线上教学;慕
期刊
摘要:现代教育理念要求传授学生文化知识的同时,也要对其心理发展情况予以关注,借助心理辅导帮助学生健康发展心理。中职教育中,引入教育心理学开展教学管理工作,不仅能提升工作水平,同时有利于学生身心健康发展。基于此,本文在阐述中职教育教学中教育心理学应用作用的基础上,探讨了具体的应用方法,以供参考与借鉴。  关键词:中职教育教学;教育心理学;应用  教育心理学是研究教育环境下师生心理规律及现象的一门科学
期刊