歌曲风格与歌手音质自动分析研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:buffisher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与通信技术的飞速发展,网络上的多媒体数据成几何级数增长,歌曲是众多数据的一种,为了快速有效的组织这些数据,就需要有高效的方法对歌曲风格与歌手音质进行自动的分类。本文主要针对歌曲风格与歌手音质的分类方法进行了研究,主要有以下几个方面的工作。首先对歌曲风格与歌手音质研究中特征的提取方法进行了研究。提出了使用适合于对歌曲处理的CQT(Constant Q Transform)特征和节奏方面的节拍直方图特征对歌曲风格进行分类,并对二者的特征提取方法进行了深入的研究。还研究了MFCC(Mel-Frequency Cepstrum Coefficients)及其一阶二阶差分、LPCC(Linear Prediction Cepstral Coefficients)及其一阶二阶差分、短时能量以及共振峰等广泛使用的特征。其次提出歌曲风格向量的表示方法以及用雷达图提供可视化分析。根据高斯混合模型的似然比建立歌曲风格向量,进而绘出雷达图,对类别之间的混识程度和双重风格歌曲的研究提供可视化分析。最后建立歌曲风格与歌手音质识别系统,对歌曲风格与歌手音质进行了深入的研究。歌曲风格方面,既研究了单一风格歌曲,又研究了双重风格歌曲,通过比较短时音质特征的识别率大小,找出适合于歌曲风格分类的短时特征,进而与长时特征进行融合,通过长短时特征的融合,取得了不错的识别率。还讨论了高斯混合数的变化对识别率的影响,CQT作用于歌曲风格分类的效果。歌手音质方面,研究了MFCC及其一阶二阶差分和前四共振峰频率的分类效果。
其他文献
目前智能手机市场上已经有多款手机搭载了例如指纹,虹膜识别等生物特征识别技术。生物特征识别技术不再仅仅是出现在那些好莱坞的大片中,它已经走进了我们的日常生活。本文研
随着网格技术的不断发展,一切网格应用都被抽象封装成为“服务”,需要为用户提供可靠、有保障的服务质量(QoS)。在这种情况下,需要良好的网格资源映射优化策略有效的分配资源
在信息化的时代,视频监控得到了长足的发展,每天从监控中产生的大量数据里面存在很多不必要的信息。这些不必要的信息占用了存储资源。如何从这些视频中提取出有用的信息,是
句法分析是自然语言处理领域的关键技术之一,在自然语言处理中具有十分重要的地位,它在机器翻译、信息检索、语音识别等研究中都有重要应用。在机器翻译的一些应用中,只需要
复合模式查找是生物信息学中模式发现问题的一个新的研究领域,而寻求效率更高,精度更高的复合模式查找算法将是复合模式研究领域的长期热点与目标。本文对此进行了深入的研究和
工作流管理是近年来计算机应用领域的热点之一。对于工作流的建模有多种方式,其中Petri网是用于工作流建模的一种比较重要和实用的方法。时间和资源是工作流系统中两个重要的
火灾是目前发生频率较高的一种灾害。随着经济的发展,目前各种现代化楼宇对火灾自动报警系统提出了更高的要求。本文论述了目前火灾自动报警系统的研究开发现状,分析了存在的
随着计算机网络技术的不断发展,计算机远程控制技术得到了广泛的应用,同时也面临着巨大的挑战:首先,远程控制系统作为辅助控制的工具,用户希望其尽量少或不占用被控系统的资源
科技文献检索是科研工作者不可或缺的一项重要工作。随着大量以Deep Web形式存在的数字资源不断涌现,科研工作者要获得全面、满意的文献信息,需要将同一查询重复提交到多个Deep
学位