基于人眼视觉系统特性的图像压缩算法及实现的关键技术研究

来源 :中国科学院大学(中国科学院长春光学精密机械与物理研究所) | 被引量 : 2次 | 上传用户:swatsee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机和半导体技术的迅猛发展,引领着信息时代的跨越式前进。大数据信息时代,图像数据占据了相当大的比重,在追求高分辨率,高帧频的同时,也面临海量数据传输与存储的挑战。为此许多图像的编码标准相继被提出,其中视频编码联合组(JCT-VC)发布的高效视频编码标准(HEVC),无论在视频还是图像编码方面都有着优异的性能表现。考虑到人眼是大部分图像信息的最终接收端,而传统的编码标准并没有考虑人眼的视觉系统(HVS)特性,图像编码时会残留大量的视觉冗余信息,不能够充分发挥HEVC编码标准的最佳性能。因此,在图像编码时融入人眼的视觉特性具有理论研究意义和现实应用价值。选题研究的目标是在有限的存储空间和传输带宽的条件下获得感知质量最佳的编码图像,研究的重点是实现如何将HEVC编码标准和HVS特性结合在一起以获得最佳的图像编码表现。研究工作基于HVS特性模型(包括恰可察失真和感兴趣区域模型),定义了一种数学意义上的像素感知失真测度,以估测图像像素的感知失真。并将定义的像素感知失真评价方法移植到HEVC中代替默认的客观像素失真评价方法,创建HEVC编码标准和HVS特性的关联。HEVC编码标准和HVS特性的联合编码可以降低编码过程中图像的视觉冗余信息,获到更好的图像编码表现。为实现联合编码的目标,研究将图像编码的两个关键参数失真和码率作为切入点寻找相应的解决方法。一方面在图像感知失真相同的情况下,尽可能的减少图像的编码比特;另一方面在消耗相同编码比特数的情况下,尽可能的获得更好的图像感知质量。从HEVC图像编码理论的角度分析,对问题的理解可以概括为:解决不同条件下因引入感知失真而带来的率失真优化问题。基于率失真优化理论,可以进一步将问题的关键定位在率失真优化的决定因素拉格朗日乘子λ上。选题的研究工作就是基于HVS模型和感知拉格朗日乘子的关系开展的,主要的工作和创新点包括:关于指定量化参数的条件,针对恰可察失真模型,论文提出了两种获取感知拉格朗日乘子的方法:一种是通过研究分析考虑人类视觉系统特性时和不考虑人类视觉系统特性时编码参数的关联性,先建立和图像内容无关,和失真门限值相关的感知拉格朗日乘子系数的查找表。图像编码时,再根据建立的和图像内容相关的加权公式,计算出符合编码条件的感知拉格朗日乘子。另一种是添加预处理操作,通过预处理操作统计所需要的和图像内容相关的图像失真与比特数据,然后依据率失真优化理论计算出感知拉格朗日乘子的值。针对感兴趣区域模型,本文基于率失真理论,分析了如何在引用感兴趣区域模型时选择合适的感知拉格朗日乘子,并证明了使用默认拉格朗日乘子的可行性。关于约束码率的条件,论文根据基于率失真优化理论的传统λ域码率控制方法,提出了适用于图像感知编码的码率R、拉格朗日乘子λ、量化参数QP的R-λ-QP关系模型,提出的感知模型是对传统模型的一种拓展,将传统模型作为感知模型的一种特例。为了保证编码比特分配的准确性和合理性,也提出了一种基于编码树单元的比特分配方法,实现了根据像素显著值合理分配编码比特的目标。为检验提出方法的编码表现,将所有的算法都在HEVC的算法参考软件HM(HEVC test Model)上进行了编码实现。测试实验的结果表明,针对不同约束条件所提出的解决方法,对应的图像感知编码表现都得到了不同程度的提升,证明了提出方法的有效性和合理性。同时考虑图像感知编码的实际应用问题,利用硬件并行处理的速度优势,研究工作基于开源HEVC编码核和恰可察失真模型,在指定量化参数条件下实现了基于modelsim的功能仿真测试,验证了提出方法在工程上的可实现性。
其他文献
国家自然科学基金项目“不确定性会计的理论与方法研究”由中山大学林斌教授主持,其项目批准号;70072037,批准时间:2001.01,项目起止时间.2001.01—2004.12。
人们对于汤显祖的著名传奇《牡丹亭》议论很多,也曾指出若干不足,但有一个问题似乎从未涉及,杜宝到底有无儿子?杜丽娘是否独生女?
引航道与泄洪河道交汇区水流条件复杂,极容易产生横向水流.本研究以成子河航道为例,建立数学模型,分析不同整治方案下交汇区域的流速条件,并确定优化的导流墙布置方案.在此基
居民投资渠道单一,消费不足,金融机构严控放贷等原因导致银行产生巨额存差.巨额存差造成资金的浪费,产生较大的金融风险,对我国经济运行带来严重的隐患.可通过推进利率市场化
博士后张健在中山医科大学免疫学林学颜教授指导下,进行了“肿瘤细胞株KBV200多药耐药性与中性鞘糖脂表达及免疫逃逸机制的研究”。首次以抗mdrl—ribozyme(核酶)为工具,探讨其对人口腔表皮
随着社会对绿色能源的需求,锂离子电池逐渐成为移动电子设备和电动汽车的主流电源。经过多年的发展,锂离子电池的能量密度逐渐接近嵌入式化学的理论极限,其容量和能量密度很
微藻因其具有生长速率快、光合速率高、土地需求低和适应能力强等优势,近年来被视为生产生物柴油的优质候选者,代替了大豆、棕榈等作物成为第三代生物燃料。然而,淡水消耗大
本文利用真实应变的概念得出了应变测量中惠斯登电桥非线性度的一种表示法.结果表明,在大应变测量时,电桥仍保持很好的线性.
组织社会学是社会学的一个分支学科,《组织社会学》这门课程以研究组织产生、发展到衰落过程为主要内容。作者在教学实践中,采用了实践教学法、案例分析法和研讨式教学法等教
本课题主要是为了实现计算机输入设备与显示设备色彩一致性,使颜色在输入设备和显示设备之间进行颜色传递时色彩信息损失最少,精确地复制再现色彩,实现所见即所得的效果,也就