基于内容的音乐特征提取及分类技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:pdiudiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘、机器学习技术的发展,人们已经可以利用计算机智能处理很多数据,例如文本分类,语音识别,图像识别等。但是目前学术界对音乐内容的分析与处理研究相对较少。本文基于数字信号的时域处理方法、频域处理方法以及时频域处理方法,提出了一种全新的基于内容的音乐数字特征提取方法,并利用该方法提取的音乐数字特征实现对样本集中的音乐进行分类。论文提出的特征提取方法区别于传统的音频信号处理方法,传统的音频处理方法主要指面向频域的处理方法,此类方法运用信号频域处理理论,提取特定的信号指标,例如:频谱质心、带宽、平均能量等。然而传统的信号处理方法不能有效适用于音乐信号的分析与处理,原因在于音乐信号具有很强的时变特性,是典型的非平稳信号。传统的信号分析方法只能在频域上概貌的描述音乐信号,但无法在具体时刻给出对应状态描述。为解决这一问题,论文中音乐数字特征提取方法采用小波变换理论从时频域的角度分析音乐数据信号,同时采用矩阵奇异值分解方法,对音乐数据的主要听感特征进行提取,采用提取梅尔倒谱系数的方法,对音乐中音色特征进行描述,以及提出一种全新的音乐节拍追踪算法,对音乐的节奏特征进行描述。为了验证音乐数字特征的有效性和正确性,论文中采用了空间距离度量方法,对样本集数据进行了实验分析。实验分析表明,该数字特征能够有效的从人类听觉感官的角度描述不同的音乐。在随后的分类实验中,利用提取的数字特征对音乐样本集进行分类。其中,音乐样本集[4]由6类不同乐器及音乐风格的音乐组成,分别为:吉他乐、说唱音乐、钢琴乐、轻音乐、摇滚乐、纯人声音乐。在此样本集上的分类试验取得了较高的分类正确率。在分类时,论文中分别采用了逻辑回归和支持向量机对结果进行了验证,同时分别对两种分类方法进行了对比分析。论文研究结果表明,通过该方法提取的音乐数字特征,能够显著的降低原始音乐数据的数据量级,使得基于音乐内容的计算成为可能。进而,该方法可以有效的适用于音乐数据管理、分析,音乐服务提供等诸多领域,并且具有良好的前景。
其他文献
文章简要论述了全球生物医药产业集群的发展趋势及太仓市生物医药产业现状;基于对太仓生物医药产业相关企业的调研与数据分析,提出太仓市生物医药产业发展的重点方向,并提出
HBV模型是瑞典SMHI开发研制的水文预报模型,广泛用于水文预报、未控制河流的流量模拟、设计洪水计算和水质研究。HBV/IHMS的积雪和融雪模型,可以模拟冰河和田间积雪区的降水量。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
1992年B股市场的建立是国内外经济情况共同作用的结果。从国外背景来看,随着经济一体化与金融全球化进程的推进,国际资本在各国间的流动呈现出速度快、规模大、形势多样化的
脱贫攻坚作为我国当前的重要政治任务,其长远目标就体现于要在脱贫的基础上实现贫困地区、贫困群众的整体高质量发展。因此,本文将从推动脱贫攻坚向高质量发展的背景和意义、
职业院枝的素描课程要求学生对空间形体有较深的理解,学会分析透视现象,掌握透视原理和调子规律,在此基础上掌握写生的观察方法、作画步骤和绘画技巧。本文从素描的本质和一般规
比赛性质和运动情境是决定体育伤害案件判决结果的衡平因素。其一,职业体育伤害与业余体育伤害具有根本差异。职业体育活动作为一种谋求生计的工作,具有更严格的社会责任和注
美国心理学家墨菲指出:"公元前五百年中国的老子和孔子,印度的《奥义书》,从南意大利到小亚细亚许多城帮的希腊思想家等,在哲学和心理学方面都有惊人的创见。"中国心理学史研
目的 :评价羧甲基壳聚糖对口腔重要厌氧菌的抑菌性能。方法 :选择与口腔疾病密切相关的厌氧菌 11株 ,采用梯度稀释法测定羧甲基壳聚糖的最低抑菌浓度 (MIC)。结果 :羧甲基壳
新世纪以来,我国农村开始运行农户小额贷款,这是一种创新的普惠性的金融制度安排。经过十数年的发展,逐渐壮大,一定程度上缓解了农村居民融资困难的问题,对支持“三农”事业,