面向超高清的直播编解码器技术评测方法研究及应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lintao31
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国5G标准的发布及商用化服务的快速推进,给超高清产业带来极大的助力。直播编解码器作为一个负责对直播信号进行实时编解码处理的工业化软硬件产品,是现有高清直播端到端流程中必不可少的一环。目前业内对超高清直播业务场景评测方法认知尚未普及,从而对业务支撑所需的直播编解码器的评测研究工作相对欠缺。因此,有必要研究一种面向超高清的直播编解码器技术评测方法。本文首先分析和研究了超高清视频,特别是HDR相关技术及难点,并以此特性分析了支持超高清信号的编解码标准,同时也对在超高清直播编解码器评测工作中需要使用的视频质量评测及系统功能评测方法进行分析和总结。通过研究主客观超高清视频质量评价方法和适合超高清技术特性的评测用例设计方法,帮助实现后续的评测方法设计研究。本文针对超高清直播编解码器的特性,重点研究了如何基于业务对超高清直播编解码器使用中的需求,结合评测原则设计出一套专业的、可量化的评测指标,并创新性的通过因果图法将超高清直播编解码器的输入输出进行有效定义及关联,从而完成功能评测和质量评测用例的设计。另一项重点研究工作是基于直播编解码器的系统特性及业务使用中的经验模型,提出一套可以更高效、流程化完成超高清直播编解码器评测的评测优化方案,其重要内容有:评测系统架构的设计、评测系统的方案设计以及评测方案的实现。本文在对超高清直播编解码器的技术评测研究中,从评测需求、评测原则和评测指标三个方面进行了系统的评测体系研究,另外在对评测方法的研究上,创新性的引入了因果图法来实现评测用例的设计,同时还基于编解码器的特性独特地提出一套完整闭环的评测方案并应用实现。该研究工作对帮助基于超高清业务需求评测出真正符合要求的视频编解码器,是具有一定参考意义的。
其他文献
人类在复杂的、多个说话人同时说话的环境下,具有追踪和分辨任意一个目标说话人语音的能力。通过算法建立听觉模型,使智能机器具有相似能力的问题被称为鸡尾酒会问题。语音分离是解决鸡尾酒会问题的重要技术之一。近年来,随着深度学习技术的发展,和深度学习结合的语音分离技术也开始被开发出来并取得了显著的进步。然而,大部分的研究仅仅利用了真实场景下的音频信息,其他模态的信息并未被有效的利用。本文的研究从音视频模态融
现代军事战场中,雷达越来越扮演着重要的角色,其性能的优劣往往很大程度上能够左右战争的走势。实际工程应用中,随着雷达技术的不断进步,人们对雷达的分辨率的提出了更高的要求,如今,雷达信号的覆盖带宽逐步发展到GHz级别。为了实现对超宽带雷达信号的全概率截获,宽带数字接收机必须将产生的高速数据流进行实时处理,但是超宽带雷达信号采样率高,数据量大,传统的宽带数字射频存储方式,并不能很好的适应超宽带雷达信号存
随着大规模接入和高速率服务需求的日益增长,存在天然优势的多播传输已得到研究者们的重点关注,但其广泛应用往往因为频谱利用率仍不能满足日益提升的传输要求而陷入瓶颈。而近年来以非正交多址(Non-orthogonal Multiple Access,NOMA)接入以及层分复用(Layered-division Multiplexing,LDM)为代表的非正交复用技术可以进一步增加用户接入并提升频谱利用率
太赫兹通信和探测系统是当前电子领域的研究热点之一。频率选择表面是太赫兹系统中的常用关键部件,其中特性可调的频率选择表面因其灵活性而受到特别关注。传统电磁材料和器件在太赫兹频段的可调谐性受到限制,而新兴石墨烯材料在太赫兹频段却表现出良好的电磁调控能力。因此,近年来国内外学者对石墨烯频率选择表面进行了深入研究,主要集中在其可调谐性能上。本文在此基础上,研究了具有高频率选择性的可调石墨烯频率选择表面,主
现代通信设备可能暴露在各种噪声环境中,有效量化终端的噪声抑制效果尤为重要。针对这一问题,ITU-T P.835建议书提出一种主观测试方法,从语音质量S-MOS、残留噪声质量N-MOS、整体抑噪性能G-MOS三个维度进行评价。在客观评价方面,国际上存在ETSI EG 202 396-3、ETSI TS 103 106及ETSI TS 103 281三种评价方法,但其对于中文语音的适用性有待考量。因此
Wi-Fi作为互联网接入的重要技术手段,覆盖范围十分广泛。但近十几年的研究表明,Wi-Fi不仅能支持用户无线上网,还能对用户进行室内定位和人体感知。Wi-Fi信号中的信道状态信息CSI(Channel State Information)能够同时反映信号的幅度与相位变化,其中相位信息反映的信号到达角度Ao A(Angle of Arrival)与天线阵列方向结合可实现定位。此外,人体运动对信号产生
由于不同被试的生理信号之间存在着个体差异性,脑机接口系统在推向大范围现实应用时受到了严重的阻碍。在使用传统的机器学习方法进行跨被试的情绪与疲劳检测时,个体差异性造成的数据分布差异使得模型的精度大幅下降。另一方面,现有的一些方法主要关注迁移学习中的域适应方法,训练个性化模型对新用户进行检测。然而,个性化模型的训练和校准仍然需要付出大量的时间和高昂的成本对新用户进行数据采集,这使得个性化的解决方案效率
在半导体芯片生产流程中,比如氧化、沉积流程,硅片将组批后加工。工件的组批以及批次的调度是个需要联合优化的问题,被称为批处理机调度问题。此外,批处理加工设备昂贵、生产负荷高,需要对设备进行预防性维护。本文研究考虑预防性维护的批处理调度问题,针对批处理机组批、批次调度和预防性维护联合优化问题,建立数学模型并设计求解算法。本文主要讨论两个问题,一个是考虑灵活周期预防性维护的批处理调度问题,另一个是考虑机
现代通信技术中,CP-OFDM(Cyclic-Prefix Orthogonal Frequency Division Multiplexing)是被4G LTE(Long Term Evolution)以及5G NR(New Radio)等标准做为物理层调制波形的高效多载波调制技术。而CP-OFDM技术带外辐射严重,不能有效利用空白频谱资源。因此FBMC-OQAM(Offset Quadratu
随着通信技术的不断发展,通信信号调制手段日新月异,传统的调制识别方法难以满足实际需要。在现代化通信对抗中,及时准确地获取信号的调制方式是进行信息提取和干扰引导的重要前提。论文针对现代通信对抗中的通信侦察系统,立足于实战中“实时+准确”的需要,研究设计了一种融合决策树与高阶累积量的调制识别算法,对侦获的信号进行调制分析。论文致力于分析通信信号的统计特征与频谱特性,并对两个具有递进关系的目标进行了研究