基于旋律的音乐检索关键技术研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:wandd_wind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在研究基于内容音乐检索基本理论和发展动念的基础上,着重研究了基于旋律的音乐检索算法及其在哼唱检索系统中的应用,主要创新性工作为: (1)提出旋律的表示模型,建立音乐乐谱和哼唱输入音乐之间的可对比机制。提出基于幅度差函数的动念阈值音符分割算法,实现哼唱音符的自动分割,并在此基础上根据音高频率信息构建标准音高模板。 (2)为了提高输入音高模板精度,提出基于遗传算法的旋律轮廓对齐算法。利用遗传算法的快速寻优能力,对齐和修正了输入音高模板,降低人为哼唱形成的误差,以提高模板精确度。 (3)为了提高算法的泛化能力,提出了加权平均相似度匹配算法。在融合欧式空间的精确性和动念时间扭曲算法的容错性的基础上,算法可使匹配过程模糊化,哼唱检索匹配更为有效。 (4)基于以上算法,实现哼唱音乐检索系统的原型开发,通过模块化编程,利用VC++基本实现了输入音乐片段的自动检索。 本文工作是对基于内容音乐检索技术关键算法上的研究和改进,对进一步的研究工作和实际应用,具有一定的推动和借鉴作用。
其他文献
随着硬件技术的不断革新,硬件平台的处理能力不断增强,硬件成本不断下降,嵌入式软件已成为产品的数字化改造、智能化增值的关键性、带动性技术,嵌入式软件开发在软件领域的比重越
随着大数据时代的来临,网络数据呈现爆炸式增长趋势。如何从海量的网络数据中快速高效获取知识信息成为了网络数据时代亟需解决的问题。在众多知识获取的方法中,构建领域知识库
干涉合成孔径雷达(In-SAR)技术是目前遥感成像领域的一个热点。它具有覆盖面积大,空间分辨率高,高程精度高的优点,并且可以全天时、全天候的工作,是获取三维数字高程模型(DEM
学位
InSAR是近几十年来发展起来的一项新的遥感技术。它作为传统的SAR技术和干涉技术相结合的产物,利用相干雷达信号的相位作为除幅度以外的额外信息源,能够全天时、全天候获取大
学位
随着多媒体信息处理技术的飞速发展,多媒体应用不断呈现普适化的趋势。图像和视频数据大量涌现,特别是移动互联网以及无线传感器网络越来越发达,用户对于图像和视频等视觉数据的
随着因特网的发展,Web已经成为人们获取信息的一个重要来源.如何实现Web信息的集成是当前信息领域的一个热点研究问题.本文围绕Web信息集成从Web信息提取,Web对象版本权威性
近年来,WAP移动网络设备技术高速发展,终端功能不断的强大,移动网络也在迅速增强,越来越多的人使用它们访问网络来获取所需信息资源。但由于这些设备多样化、处理能力弱和具
移动位置服务(LBS--Location Based Service)又称定位服务,是通过通信网络获取移动终端用户的位置信息(经纬度坐标),在电子地图平台的支持下,为用户提供相应服务的一种增值业
随着社会媒体的日渐繁荣,人们越来越多的在不同的社交网站上分享生活中的感受。简短的社会媒体内容包含了巨大的商业价值,因此,对社会媒体的情感分析越来越重要。面向社会媒体的
激光导引头电子舱是导弹探测、跟踪目标物体的关键部件,它为导弹系统的精确制导提供了重要保证。因此,导引头电子舱产品使用前的调试和检测至关重要,它们是保证电子舱的安全性和