一种基于统计机器学习的工尺谱翻译方法

来源 :北京大学 | 被引量 : 0次 | 上传用户:wsf3344
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
工尺谱作为一种中国古代乐谱,常用于昆剧等中国传统音乐。工尺谱拥有完整的音调、音高标记,但是节奏标记不完备,一个节拍内音符的时值划分不明确。因此,工尺谱一般都以“口传心授”的方式进行传承。然而,精通工尺谱的专家愈来愈少,为了便于工尺谱的传唱,当前部分工尺谱专家致力于将工尺谱翻译成五线谱。  通过对工尺谱元素的研究,我们发现虽然工尺谱本身对节奏的标记不够健全,但是在民间演奏时每个音符的时值是由乐谱内在特征所决定的,并不任由演奏者主观发挥。因此本文尝试从工尺谱中提取潜在的数据特征,并利用统计机器学习的方法,主要是分类模型,对工尺谱的节奏模式进行分析与挖掘。  在本文中,我们以节拍为标注单位,将节拍的每一种时值划分视为一种类别标签,由此工尺谱翻译问题转化为根据上下文为每个节拍选择特定标签(或者标签所代表的时值划分)的问题。我们尝试了多种常用的统计机器学习算法,包括朴素贝叶斯、最大熵以及最近邻。实验证明采用基于统计机器学习的方法可以获得较好的标注效果。更重要的是,结合工尺谱特有的音乐特征,我们定义了一种称为“共现概率”的度量方法来衡量工尺谱特征之间的相似度,并在此基础上实现了一种基于局部一致性策略的bootstrapping算法,进一步显著提高节奏标注准确率。  最后,我们对分类模型进行了多组对比实验,实验结果表明:  ·“共现概率”度量方法相比其他方法可以更好地衡量节拍之间的距离;  ·基于局部一致性策略的bootstrapping算法对工尺谱节奏标注的准确率最高;  ·在训练数据规模小的情况下,我们的方法仍然可以获得比较高的标注效果。  作为一次采用统计机器学习方法解决工尺谱节奏标记的尝试,我们的工作对保护中国传统文化遗产起到了积极的作用。
其他文献
许多大型网站、运营商和数据中心都采用Multihoming技术,使用多条链路与Internet相连以提高网络可靠性,加速网络访问。对不同的目标地址选用质量最高的链路出口可以最大限度
互联网从诞生以来一直遭受着黑客攻击和恶意代码的威胁,随着互联网成为人们日常生活不可或缺的一部分,由地下经济链等多种因素驱动,新形态的安全威胁不断涌现并持续演化,从计
当今社会化媒体正在获得越来越多的关注,并且已经成为许多网民日常生活的必要元素。不同功能的社会化媒体网站为用户提供上传信息、图片、视频等各种类型资源的平台。除资源上
随着近年来假币犯罪案件的高发,案件数量逐年增多,涉案金额越来越大,呈现出团伙性作案的特点,这极大影响了社会的经济秩序。由于案件数量的增多,传统的由警员手动分析案件的方式已
在纺织工业界,由于各种原因存在许多遗失原始设计稿件的织物样品。通常对遗失设计稿件的织物进行再生产,就必须先由经验丰富的设计人员对织物样品进行手工临摹来得到设计稿,
在印刷行业中,图像由于其直观性和广泛适用性,对印刷品的质量起着至关重要的作用,对于承印物为织物的纺织印刷业中来说就更是如此。因此,印前图像处理便成了印刷过程中不可或
随着XML数据被广泛应用于互联网服务、信息集成等各个领域,针对XML数据的结构化查询,尤其是作为其核心操作的多分支查询,已经在研究领域成为一个热点话题。虽然在最近几年,为
计算机辅助设计(CAD、Computer Aided Design)在工业界已经得到广泛应用,极大促进了汽车、航空、航天、造船、建筑等行业的发展。离散曲面形变是CAD领域的研究热点之一,但是
任务群计算(Many-Task Computing,MTC)是广泛应用于科学计算领域的一种大规模松耦合任务并行计算模式,目的是在较短的时间内完成大量资源需求相同的可独立调度任务。这种模式下
经过多年的研究与应用实践,基于relation数据库引擎扩展XML管理功能已成为共识。目前,各大商用数据管理系统DB2,ORACLE,SQL SERVER以及开源数据管理系统(MonetDB,GALAXY,xlnd