基于本体聚合多层描述符的音乐情感信息检索研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户：ptcptsu

【摘要】

：

随着数字音乐的迅猛发展，面向海量的数字音乐内容的各种应用向音乐信息检索领域提出了“智能化”的需求，因此支持语义的音乐信息检索的研究越来越重要。本文提出基于本体聚合多

【作者】

：

王珺

【机构】

：

中国科学院声学研究所

【出处】

：

中国科学院声学研究所

【发表日期】

：

2009年期

【关键词】

：

音乐信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着数字音乐的迅猛发展，面向海量的数字音乐内容的各种应用向音乐信息检索领域提出了“智能化”的需求，因此支持语义的音乐信息检索的研究越来越重要。本文提出基于本体聚合多层描述符的音乐情感信息检索研究，旨在解决音乐情感信息检索中的重点和难点问题，为实现更加人性化、智能化的音乐检索应用提供研究基础。　　本文的主要研究内容包括以下几个方面：　　 1)研究了基于内容的音乐情感信息分类方法；　　 2)设计了面向情感信息检索的音乐本体；　　 3)研究了基于内容和Web关联技术的多层音乐描述符的聚合方法；　　 4)研究了基于本体的音乐情感信息检索方法；　　 5)最后，研究了上述基于本体的方法在面向其它音乐语义信息检索领域时的可拓展性和有效性。　　依次针对以上各个方面的研究内容，本文的主要贡献归纳如下：　　 1)面向音乐情感信息检索，给出了一个基于音频内容提取的低层特征集空间；采用了特征子集选择算法有效减少了冗余特征、减轻了训练集特征的过耦合问题，得到的测试准确率相对于未采用该算法的方法的准确率提高了9.53％；研究了结合径向基(Radial Basis Functions，RBF)核函数和似然积核函数(ProbabilityProduct Kernels，PPK)的支持向量机分类方法，较采用单RBF核的方法和采用单PPK核的方法，在准确率上分别提高了约6.02％和10.93％。　　 2)设计了针对音乐情感信息检索的音乐本体，它能够有效地组织和联系各层信息，解决单纯的基于内容的方法难以达到足够好的分类性能、音乐低层特征和高层感知之间存在“语义空白”的问题。该本体在具备音乐情感专门领域的特殊性的同时，还具备本体开发的延续性，可作为音乐领域中现有本体的一项重要扩展。　　 3)开发了基于CLAM(C++Library for Audio and Music)架构对低层音乐特征、基于网络的音乐描述符等多层音乐相关信息进行聚合的平台，较传统的基于网络爬虫获取信息的方法，本平台所采用的方法能够将音乐文件同网络资源进行准确的关联，并且允许用户通过GUI灵活配置多层音乐信息的聚合。提出了面向P2P的基于RDFPeers的架构，与传统P2P中的架构相比，不仅支持静态信息，还支持动态信息的聚合与检索。　　 4)提出将传播激活算法用于基于本体的音乐情感信息检索的方法。该方法的预测准确率达到60.57％，较单纯基于内容的方法的准确率提高了约30％，并且实验证明本系统的性能可随着系统知识规模的增大而提高。　　 5)通过推理的方法得到新的语义高层的解释，能够对基于语义的音乐描述知识库进行自动扩展，从而可用于支持语义的音乐信息检索。通过实验和分析，验证了本文提出的聚合低层和高层描述符的方法，较传统的采用单层描述符的方法，具有更高的准确率和召回率。

其他文献

面向三重业务的地面电视双向化方案与无线回传关键技术研究

地面数字电视广播系统以其能够满足现代信息社会“信息到人”，接收简单以及可移动接收的特点，在广播电视体系中占据了非常重要的地位。而随着地面数字电视广播在世界范围内全面

学位

地面数字

基于试验与模型的C、N循环研究—以华北高产粮区桓台县为例

本论文以桓台县高产农田生态系统为例，研究了不同秸秆还田模式和施氮量对农田N2O与CO2排放以及土壤硝态氮含量的影响，并通过对引进DAISY模型的参数调整对其进行模拟校验，从而为

学位

秸秆还田氮肥CO2排放DAISY模型高产农田生态系统

基于油气目标评价的灰色遗传神经模型及应用

储层油气的识别评价己成为国内外石油工作者十分关注的研究课题，准确识别评价可为油气开发的规划与部署提供重要的数据基础，提高勘探效果。目前我国大多数油气田进入开发中后期

学位

油气目标评价遗传算法灰色关联分析BP神经网络测井曲线

防伪电子签章系统的研究与设计

随着信息化的飞速发展，将会有大量的电子文档需要通过网络来传输和签发，电子文档的完整性及安全性越来越受到重视。数字签名技术和数字水印技术被广泛地应用于电子文档的完整性

学位

数字签名数字水印中间件技术防伪电子签章系统需求分析模块设计

高分辨率SAR陆地杂波的建模和模拟

采用统计方法对杂波建模具有重要的意义。一方面，它可以帮助我们更好的理解杂波的散射特性，从而有效的指导雷达目标检测和识别算法的设计和改进；另一方面，统计特性作为先验知识，可

学位

雷达杂波统计分析合成孔径雷达散射特性目标检测统计模型概率密度函数

“我们的生活、我们的快乐”绘画作品展举办

2014年1月7日,由文化部艺术司、全国妇联儿童工作部、全国妇联离退休干部局、吴作人国际美术基金会萧淑芳美术基金支持,全国美术馆专业委员会、中国妇女儿童博物馆主办,《中

期刊

绘画作品全国妇联儿童博物馆中国妇女文化部艺术司非专业人士中国文化报美术文化萧淑芳离退休干部

基于ISSR分子标记的角倍蚜种群遗传多态性

蚜虫类属昆虫纲Insecta，同翅目Homoptera，世界上已知种类近4000种，我国近千种。根据张广学形态支序分类系统，我国蚜虫分为2总科(球蚜总科和蚜总科)13科251属1000余种。五倍子是我

学位

角倍蚜ISSR分子遗传多态性

基于以太网的数控机床远程实时监控系统关键技术研究

计算机技术的普遍运用和发展，使得智能化、网络化成为当代数控机床发展的主要趋势。但我国现有的机床与外界的通信大多均采用RS-232串行口。这种通信方式的一个缺点是通信线路

学位

以太网数控机床远程实时监控系统实时通信数据存储

颠茄（Atropa belladonna L.）组织培养与新种质选育研究

颠茄(AtropabelladonnaL.)为茄科(Solanaceae)颠茄属(AtropaL.)植物，多年生草本，全草入药，为常用中草药之一。全草含颠茄碱、莨菪碱以及东莨菪碱等，有抗胆碱等功效，可用于镇静、麻

学位

颠茄组织培养多倍体秋水仙素

基于DSP和CPLD的移相全桥开关电源数字控制器的应用研究

经颅磁刺激(Transcranial Magnetic Stimulation简称：TMS)是一种能够在脑中感应聚焦电流，瞬间调制大脑皮质的无创方法。在临床研究、基础神经学和诊治脑疾病等方面有许多应用。

学位

经颅磁刺激仪移相全桥开关电源数字控制器DSP芯片复杂可编程逻辑器件

基于本体聚合多层描述符的音乐情感信息检索研究

与本文相关的学术论文