论文部分内容阅读
随着多媒体技术、计算机网络技术和音频识别技术的快速发展,音频匹配在音频、多媒体文件的数据分析和音频辅助教学等领域中已经成为非常重要的课题。音频匹配技术是以音频识别技术作为基础,对音频参考模板和音频测试模板进行特征提取与表达,得到能够完整地表达二者音频特征的特征序列后,运用匹配算法对音频信号特征进行匹配的过程。音频匹配的目的在于得到音频参考模板与音频测试模板在音频特征上的近似度,从而运用于音频模型的训练、评价、多媒体检索、声波加密和解密、卡拉OK歌唱打分等多个领域。本文以MP3音频多媒体文件以及用户对照MP3文件歌唱所建立的音频文件为匹配与研究对象,MP3音频多媒体文件作为音频参考模板、用户对照MP3文件歌唱所建立的音频文件作为音频测试模板,主要对音频特征提取、表达和两种模板的匹配算法进行了研究,在此基础上提出了一种倒谱分析结合短时能量分析的特征提取方法以及字符串匹配结合动态时间规整计算模板的近似度。本文主要工作如下:(1)定义模型的输入。选取一首MP3音频多媒体文件,用户对照MP3音频文件通过音频输入设备录入一段歌唱音频,将该MP3音频信号作为音频参考模板,用户歌唱的音频信号作为测试模板,对声波进行去噪、预加重、分帧等一系列预处理。(2)对预处理完成后的音频参考模板与音频测试模板的波形使用本文提出的倒谱分析结合短时能量分析进行特征提取工作。由于歌曲的声音成份十分复杂,因此考虑了如何将MP3音频中的背景音乐滤除,减轻特征提取的工作量。(3)运用改进的匹配算法从音频参考模板与音频测试模板中提取出音高差值序列及音长比值序列并对它们进行近似匹配,本文提出的字符串匹配结合动态时间规整算法提高了近似度模型匹配的效率与精度。(4)采用本文提出的近似度函数对音频参考模板与音频测试模板进行最终的近似匹配评分,最终建立一个公平、准确的音频近似度评分系统。最后对改进的匹配算法与传统匹配算法进行了对比实验分析。通过完成上述工作内容、实验验证了论文中算法的有效性。所建立的评分系统实现了音频参考模板与音频测试模板的近似匹配评分,在音频特征提取与匹配方面进行了有效的探索与研究。