论文部分内容阅读
随着数字音乐的迅猛发展,面向海量的数字音乐内容的各种应用向音乐信息检索领域提出了“智能化”的需求,因此支持语义的音乐信息检索的研究越来越重要。本文提出基于本体聚合多层描述符的音乐情感信息检索研究,旨在解决音乐情感信息检索中的重点和难点问题,为实现更加人性化、智能化的音乐检索应用提供研究基础。
本文的主要研究内容包括以下几个方面:
1)研究了基于内容的音乐情感信息分类方法;
2)设计了面向情感信息检索的音乐本体;
3)研究了基于内容和Web关联技术的多层音乐描述符的聚合方法;
4)研究了基于本体的音乐情感信息检索方法;
5)最后,研究了上述基于本体的方法在面向其它音乐语义信息检索领域时的可拓展性和有效性。
依次针对以上各个方面的研究内容,本文的主要贡献归纳如下:
1)面向音乐情感信息检索,给出了一个基于音频内容提取的低层特征集空间;采用了特征子集选择算法有效减少了冗余特征、减轻了训练集特征的过耦合问题,得到的测试准确率相对于未采用该算法的方法的准确率提高了9.53%;研究了结合径向基(Radial Basis Functions,RBF)核函数和似然积核函数(ProbabilityProduct Kernels,PPK)的支持向量机分类方法,较采用单RBF核的方法和采用单PPK核的方法,在准确率上分别提高了约6.02%和10.93%。
2)设计了针对音乐情感信息检索的音乐本体,它能够有效地组织和联系各层信息,解决单纯的基于内容的方法难以达到足够好的分类性能、音乐低层特征和高层感知之间存在“语义空白”的问题。该本体在具备音乐情感专门领域的特殊性的同时,还具备本体开发的延续性,可作为音乐领域中现有本体的一项重要扩展。
3)开发了基于CLAM(C++Library for Audio and Music)架构对低层音乐特征、基于网络的音乐描述符等多层音乐相关信息进行聚合的平台,较传统的基于网络爬虫获取信息的方法,本平台所采用的方法能够将音乐文件同网络资源进行准确的关联,并且允许用户通过GUI灵活配置多层音乐信息的聚合。提出了面向P2P的基于RDFPeers的架构,与传统P2P中的架构相比,不仅支持静态信息,还支持动态信息的聚合与检索。
4)提出将传播激活算法用于基于本体的音乐情感信息检索的方法。该方法的预测准确率达到60.57%,较单纯基于内容的方法的准确率提高了约30%,并且实验证明本系统的性能可随着系统知识规模的增大而提高。
5)通过推理的方法得到新的语义高层的解释,能够对基于语义的音乐描述知识库进行自动扩展,从而可用于支持语义的音乐信息检索。通过实验和分析,验证了本文提出的聚合低层和高层描述符的方法,较传统的采用单层描述符的方法,具有更高的准确率和召回率。