基于生成对抗网络的自动作词作曲算法研究

来源 :孙芳蕾 | 被引量 : 0次 | 上传用户:laoyet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在音乐的发展历程中,计算机技术曾起到过重要的推进作用。正是计算机技术将音乐电子化、数字化,音乐才能传遍天南海北,传进千家万户。随着计算机科学高速发展,人工智能算法已经在生活中的许多场景得到应用,然而智能算法在音乐领域的应用稍显单薄。这是由于音乐的结构比常见的文本更为复杂,其背后的艺术性也较难以量化描述,给算法理解带来了难度。歌词和旋律是音乐中两个最为重要的要素。为了实现音乐创作,现阶段的歌词生成任务主要被视作自然语言生成任务的一个现实场景应用问题,具有较强的现实意义。由于歌曲中歌词和主旋律往往是有强烈相关性的,在真实的创作中,常常是先创作歌词,然后为其谱出对应旋律。如果人工智能算法能够在给定歌词的基础上生成对应的旋律,那么广大音乐爱好者可以从中得到许多帮助与启发。本文基于生成对抗网络对歌词生成和旋律生成这两个任务展开进行研究,主要研究工作和创新点如下:(1)本文提出了一种融合生成对抗网络和演化计算的思想的文本生成算法。该算法采用含有自注意力机制的关系记忆核模型作为生成器,能够更好地对文本数据中时间域的记忆进行建模;该算法还融合了演化计算的思想,能够主动为生成器主动探寻更适合当前环境的策略,从而把握生成质量和多样性之间的权衡,缓解模式坍塌问题。在中英文本语料上的实验证明了算法能够生成高质量且多样性较高的文本。随后,本文将此算法应用进歌词生成任务,并根据歌词任务特点对模型进行了改进,使其更适用于歌词生成场景,并进行歌词语料实验证明其有效性。(2)本文提出了给定歌词的前提下基于条件生成对抗网络的旋律生成方法。该方法以歌词的文本词向量信息作为生成器的输入生成旋律,并交由判别器评判其音乐性与歌词旋律对应关系,判别器的反馈结果再用于旋律的改进。本文随后进行了基于真实音乐语料库的实验,并通过自动评价指标、描述性统计指标以及基于音乐乐理规则定义的原创指标Music-BLEU从多角度对实验结果进行分析,证明了该方法相对基线模型而言可以生成综合效果最好的音乐旋律数据。
其他文献
随着智能语音技术的发展,说话人确认技术逐渐进入人们的日常生活与工作中。如何进一步降低说话人确认的错误率、如何在计算资源有限的终端实现说话人确认是目前智能语音处理领域的研究热点。本文探讨基于深度神经网络的说话人确认及其轻量化问题。论文的主要工作及贡献如下:(1)提出基于注意力空洞残差卷积循环网络(Attentive Dilated Res2Net Recurrent Network,ADRRN)的说
学位
5G的到来和物联网的发展前景为穿戴式智能终端提供了新的动力和发展趋势。“万物相连”的理念要求可穿戴设备不局限于手机、手表、耳机等传统形式,应尽可能地集成于人们日常可穿戴物件中。作为此类无线设备的重要组成元件,可穿戴天线也需要具备便携、轻量、穿戴舒适等特性。将可穿戴天线与衣物集成一体化对实现无线体域网(Wireless Body Area Network,WBAN)应用及新型物联网可穿戴设备具有重要
学位
随着人类对海洋资源的开发和利用,水声通信与探测技术越来越受到重视,而其质量受多普勒效应影响严重。线性调频(Linear Frequency Modulation,LFM)信号由于具有较好的多普勒容限,常用作于声呐信号。目前针对水声信道发送端为单分量LFM信号的多普勒因子估计方法已被深入研究。随着多输入多输出(Multiple-Input Multiple-Output,MIMO)技术在陆地通信中的
学位
当下人类生存方式发生了巨大变革给未来人才提出了新的诉求,教育从过去更注重知识和技能变得更加注重素养。科技教育是应对未来社会变革的新重点,提升科技教育水平对国家、社会和个人都有着重要作用。而新时代的科技教育对教学空间提出了新的需求,驱动了中学科创中心这类新型空间的产生,并驱动空间模式的转变。中学科创中心作为新型的教学空间,未来有着大量建设的趋势,但却存在场地不充足、建设无标准、模式不适应等情况。国内
学位
自2009年全国33所高校首批开设社会工作硕士专业学位(MSW)以来,我国的社会工作硕士教育迅速发展,截止至2021年8月,全国有156所高校开设了MSW培养点。在社会工作硕士教育不断扩大完善的同时,在职社会工作者在各类因素的驱动下选择就读MSW成为了一种普遍现象,因此了解在职社会工作者就读MSW的意愿及其影响因素是十分必要的。本研究使用华东理工大学2019年中国社会工作动态调查(CSWLS201
学位
近些年随着互联网产业的发展,语音识别技术的应用越来越广泛。基于注意力机制的端到端语音识别模型(Attention-based Encoder-decoder End-to-end ASR model,AED)由于训练简单,效果比传统的语音识别模型更好,得到了大规模的应用,并且成为了学术界的研究重点。但是AED模型容易学习到语言偏见从而影响模型的识别准确率。因此需要消除AED模型中的语言偏见才能进一
学位
无人机自组网具有节点自由移动、拓扑动态变化、信道带宽受限、节点分布不均等特点,因此设计良好的路由协议是构建无人机自组网的关键。由于无人机自组网中节点高速移动导致网络拓扑结构剧烈变化,严重影响了网络性能,一方面基于拓扑结构的传统路由协议无法取得良好的路由性能,另一方面随着定位技术的发展,无人机能方便获取位置信息,使得基于地理位置信息的路由协议被广泛应用在无人机自组网中。本文重点研究经典的地理位置路由
学位
近年来,5G通信技术凭借其更低的网络延迟和更快的数据传输速度,正逐步取代4G成为移动通信中的研究热门。5G的主要应用频段包括Sub-6GHz和毫米波频段,其中毫米波频段通信对射频器件和天线结构都提出了更高的要求。5G毫米波通信的关键技术主要包括大规模天线技术(Massive MIMO)、波束赋形技术和波束管理技术,这要求所设计的5G毫米波天线有更大的阵列规模,更快的波束切换速度和更大的波束扫描范围
学位
提高系统的频谱效率,增加资源的利用率以及降低信号检测系统的复杂度是无线通信研究领域的关键问题。正交频分复用索引调制(Orthogonal Frequency Division Multiplexing with Index Modulation,OFDM-IM)是索引调制在频域内应用的一项提高无线通信系统能源效率的极具潜力的技术,但由于OFDM-IM不激活的子载波无法调制信息且激活的子载波仅采用相
学位
目前,我国心智障碍者数量已突破千万,心智障碍者成为了一个庞大的弱势群体,走进了公众的视野。随着医疗技术的不断进步,心智障碍者的健康得到了前所未有的保障,其平均寿命也在不断延长。与此同时,心智障碍者的照料者也逐渐步入老年,此类由大龄心智障碍者与年迈照料者所构成的家庭被称为“心智障碍者双老家庭”。与普通家庭相比,双老家庭不仅需要应对心智障碍者的照料问题,还需要解决照料者的老化问题,始终存在着“残障”与
学位