基于歌词的音乐情感分类技术研究

来源 :东北大学 | 被引量 : 5次 | 上传用户:yayabaobao123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐是人们日常生活中不可缺少的组成部分,它作为一种独特的抒情方式和重要的交流媒介,其中携带着丰富的信息。近几年来,互联网成为音乐的新载体,互联网的高速发展使网络上音乐的数据急剧增加,种类也日益繁多。如何借助计算机技术对网络音乐数据进行有效的管理已经成为信息处理领域的研究热点。本文着重研究基于歌词的音乐情感分类。首先,本文将音乐情感分类看作是二元分类问题,对情感分类中的几个基本问题进行了研究。其一,在监督学习框架上,研究了分词预处理的准确性对最终情感分类的影响,验证了构建音乐领域专用分词工具的必要性;其二;研究了多个常见的分类器在音乐情感分类领域的性能,其中包括最近几年受到较多关注的主题模型;其三,本文研究了不同的特征值计算方法对性能的影响,及向量归一化对分类性能的影响。其次,由于音乐情感分析领域中经过人工标注的数据资源相对匮乏,本文研究了在标注数据有限的情况下的音乐情感分类问题。为此本文采用了两种不同的学习框架:部分监督学习和半监督学习。部分监督学习关注的是单类别学习的问题,即训练数据中只有一类数据带有标注信息;半监督学习则关注如何利用无标注数据改进分类性能的问题。在本文的半监督学习研究中,本文特别关注了通过主题学习获取文档中的主题信息并将其作为新的分类特征。实验结果表明:主题信息和无标注数据对提高情感分类性能有较大的帮助。最后,词典方法是音乐情感分类中常用的方法之一,为减少构建词典的人工代价,本文研究了两种不同的情感词典自动扩展方法。其一,应用bootstrapping方法从无标注数据中学习情感词以扩充情感词典;其二,本文认为人工标注数据的难度要低于构建词典,因此本文研究如何从有标注数据上挖掘情感词。
其他文献
随着电子商务技术的蓬勃发展,需要有一种技术可以快速、高效的建立企业级商务应用。J2EE就是这样一种技术,它提供了一种基于组件的方法,来设计、开发、集成和部署企业级应用。J2
随着Internet的飞速发展,网络系统安全变得越来越重要.公钥基础设施(Public Key Infrastructure, PKI)已成为大多数重要的Internet和无线通信的安全机制的基础设施,例如,VPN,
从防范恶意主机攻击的角度,该文提出基于Java Obfuscator的移动代理黑箱构建方法,以避免移动代理代码被恶意主机所理解,从而使得恶意主机无法发起有效的篡改攻击.从检测恶意
随着计算机技术、互联网技术的飞速发展,教育信息化得到了广泛推行,计算机辅助教学也已经渗透到了教学的各个环节,其发挥的积极作用备受社会重视。近些年来对于利用无纸化考
该文以研究PCMM理论框架体系入手,分析People CMM的层次及组成,以及对软件企业的管理的作用和影响.People CMM包含五个成熟度等级,每个成熟度等级完整地定义了进化的平台,制
“影子网络”是美国为了实现其政治目的和战略利益而建立的一个隐形网络。该网络能够突破特定国家的监管、审查,其破坏性是巨大的。因此,研究反制措施具有重要的安全意义。提
本文首先提出了一种新的网络应用,无线终端通过AP接入校园网,从而实现校园网中无线终端之间的语音通信,校园网的宽带为这一应用提供了必要条件。接着,本文从基于H.323协议的VoIP
NMG(Network Management Gateway)网关是一个功能强大的网络管理网关,为Intranet连入Internet提供了有效的手段.不仅为客户提供了各项基本接入服务,而且提供了虚拟专用网VPN
随着网络业务的复杂化,传统的TCP/IP网络架构已不能满足人们的需求,为此互联网研究人员提出了一种把控制平面与数据转发平面相分离的新的网络架构,即软件定义网络(SDN)。SDN把控
无线传感器网络由大量部署在监测区域内的微型传感器节点通过自组织、自适应的方式构成,这些传感器节点具有一定的感知能力、数据处理能力和通信能力。无线传感器网络中的节