基于结构特征的音乐重构关键技术研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:deqiangranran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的快速发展和互联网的迅速普及,可供人们使用的多媒体素材规模急速增长,不同类型的多媒体数据融合的应用也逐渐增多。现实中,大量跨媒体融合应用需要对乐曲时长进行约束,以便满足应用场景对乐曲的时域要求。然而,当用户所需时长与乐曲原长差别稍大时,现有的音乐处理技术均无法产生满足用户所需时长的高质量乐曲版本。本文提出的音乐重构技术旨在通过音乐结构分析,有效利用剪切、冗余插入、时域拉伸、时域压缩、整曲重复等基本操作,自动生成满足用户指定时长的乐曲版本。本文的工作包括:1.通过观察乐曲音频时域压缩抗性与歌唱速度的关系,提出了一种基于歌词密度的非均匀音乐时域压缩算法。该算法通过歌词密度估计乐曲中各个乐曲段在时域压缩后的质量衰减情况,而后根据乐曲的质量衰减分布非均匀地分配乐曲中各段的压缩率,从而缓解乐曲因时域压缩产生的听觉瑕疵现象。2.考虑音乐时域修改对乐曲音频内容的影响,提出了一个基于音频特征和歌词特征的伸缩抗性评估模型,并给出了基于该模型的音乐时域伸缩算法。实验证明,该算法可适用的伸缩率范围更广,在相同伸缩率下产生的重构乐曲的质量相比现有技术具有更好的音频质量。3.为了减缓重构过程中剪切操作和插入操作对重构后乐曲旋律及内容连续性的影响,提出了保持边界连续的乐曲段序列冗余插入/剪切算法。该算法以乐曲段重复检测技术为基础,通过分析相同乐曲段在原始乐曲中的上下文关系获得乐曲连续性约束模型,进而找出不破坏乐曲连续性的最佳剪切/插入方案。4.总结了现有音乐编辑的基本操作,归纳出可用于解决音乐重构问题的五个基本操作—时域拉伸、时域压缩、整曲重复、剪切和插入。根据各个基本操作的实现特点,提出了一种通用的音乐重构框架,可依据所需目标时长实现自动化的音乐内容重构,产生满足所需时长约束的乐曲版本。
其他文献
街道法律诊所源于美国,依托于街道法律诊所的基本理念,在结合本土现实情况基础上,尝试构建了一种新的街道法律诊所模式——培训援助式街道法律诊所教育新模式。首先界定了新
时下,反思性教学已经越来越深入人心,甚至成了衡量教师是否优秀的指标之一。而当今对教师的反思研究主要集中在在职教师领域,对中等师范生反思能力的培养研究则比较少。从中
中国为什么没有发展出资本主义?中国历史上是否有资本主义的萌芽?什么是资本主义?这些都是让人感兴趣的问题。资本主义就是国家权力不得侵犯公民个人的权利,就是运用国家权力的力
介绍了天津商业大学热能与动力工程特色专业建设思路与目标,建设内容与人才培养特征,以及特色专业建设所取得的阶段性成果。
图书馆阅读文化是高校广大读者长期形成并共享的一种阅读理念、阅读价值取向以及阅读行为习惯。通过对高校图书馆阅读文化的认识,分析了当前大学生的阅读现状及其产生的原因,
短时间序列广泛存在于电子商务、宏观经济、科学研究、公共管理等领域。短时间序列数据的基本特征是单条序列的观测数量较少,难以直接应用已有的时间序列挖掘算法。本文分析
本课题旨在提高医疗护理过程中人性化服务质量,如静脉滴注速度的监控、报警、调节,以减少护理人员及其家属工作量,给患者及家属一种放松感、安全感,与此同时,可以避免医疗事
目的进一步认识青年人颈椎病的临床特征,探讨其发病的危险因素和防治方法。方法对就诊的颈椎病患者的病史、生活习惯详细调查,完善体格检查和影像学检查,并进行随访,年龄在15-30