音乐歌单生成系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:bjbdn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字音乐产业的发展,歌单在音乐平台消费中扮演着越来越重要的角色。但目前大多热门歌单仍由人工创建,不仅耗时,还需音乐知识,因此需要一套生成系统来高效地创建歌单。这时主流的推荐算法在缺乏用户数据以及推荐新项目的情况下并不适用,而解决这类冷启动问题的办法一般是分析歌曲共有的语义属性,建立音乐与标签的关系。但对于语种、风格、场景、情感和主题等不同的标签,又存在着“语义鸿沟”等诸多难题,且以往人工设计的短时音频特征不足以解决这样的多标签分类问题,需要找到有效的音乐特征提取方法。为了解决上述问题,本课题主要完成的工作如下:1.设计了一种语义更丰富的音乐特征提取算法。通过利用垂直滤波器来提取梅尔声谱图中音色相关信息,利用帧级注意力机制提取出长短时依赖信息,利用分层组合提取出不同层所包含的信息,利用元数据等信息拼接得到多维音乐特征,以此实现音乐相关特性的充分挖掘,并在AotM-2011数据集上验证了模型性能,算法的PR-AUC指标相对以往最优模型提升了 0.29%。2.设计了 一种更精确的音乐自动标记算法。通过自上而下的方式捕捉音乐与层次结构中每个标签之间的关联,建立了不同层次之间的依赖关系模型,同时设计了一种结合全局和局部损失的混合方法,并利用投票机制来计算歌曲各片段的综合评分,从而得到歌曲和歌单更精确的标签,并在FMA数据集上验证了模型性能,算法的ROC-AUC指标相对以往最优模型提升了 2.28%。3.设计了一种歌单自动生成方案。根据输入的不同分为两种情况:其一,已知歌单标签,根据歌曲热度等外部因素来生成歌单;其二,以歌搜歌,利用其特征向量,进行歌曲的相似度搜索,从而填充歌单,实现歌单的自动生成。然后基于上述方案实现了相应的歌单生成系统,并通过算法组件封装和前端页面展示等方面验证了其有效性。
其他文献
在大数据时代,医疗、交通、通信等各行各业的数据扑面而来,信息的呈现形式也趋于多元化。面对海量的数据,广义粗糙集理论与方法能够有效地从中挖掘有用的信息并用于数据处理与分析,提高信息获取的能力。本文在覆盖粗糙集理论的基础上,将商空间理论与粗糙集理论结合起来,研究了商空间上的覆盖及其相关算子与矩阵计算方法,建立了粗粒度信息空间与细粒度信息空间之间的联系,解决了粗粒度信息空间中粒子的描述问题。商空间及其上
无人机基站凭借其灵活、高移动性的优势可以为无线设备提供高可靠、低时延的通信服务。相较于单无人机系统,多无人机通信系统可以显著地提升工作效率,进而成为了当前的热点研究方向。当多个无人机基站在区域内共同提供数据传输服务时,如何合理地分配服务区域、动态调整无人机数据采集模式及飞行轨迹将显著影响通信过程中的数据服务量与任务完成速率,因此引发了研究领域的广泛关注。本课题针对提升多无人机基站工作效率与网络性能
随着移动通信和汽车产业的快速发展,车联网(Vehicle to Everything,V2X)通信技术受到了科研学者和相关组织的广泛关注。当前,面向第五代(the Fifth Generation,5G)移动通信技术的V2X标准化工作已经在第三代合作伙伴计划(the Third Generation Partnership Project,3GPP)等国内外标准化组织的推动下全面展开。其中,资源调
相比较传统无线通信网络,车联网(Vehicle-to-Everything,V2X)具有节点移动性高、通信环境复杂、频谱资源更有限等特点,因此需要设计针对V2X的拥塞控制策略。基于优先级的通信作为车联网提供服务质量(Quality of Service,QoS)支持的方法之一,通过为关键信息提供更高级别的通信保障,提高V2X中的通信质量及无线通信资源的利用效率,在拥塞控制中也有一定应用意义。基于上
随着整个社会的信息化的不断发展,互联网的规模也在不断增大。研究网络流量分类算法并建立相应的网络流量分类系统能够产生巨大的社会价值以及经济效益,并对通信网的发展具有重大意义。随着互联网技术的不断发展,各种新型的网络应用不断地被开发出来,而且它们自身都具有独特的流量特征,这使得在通信网中进行传输的网络流量数据的特性变得更加复杂,对网络流量进行有效的分类和管理也变得日益困难。通过网络流量分类技术,将通信
随着互联网和多媒体技术的快速发展,数字音像制品以及其他电子出版物的传播和交易变得越来越便捷。如何在利用到互联网便利性的同时,有效的保护数据的安全与电子出版物的版权成为了一个亟待解决的课题。传统的信息加密技术通过加密算法将明文转换为无法阅读的密文,但这很容易引起攻击者的注意,而且难以应对暴力破解等手段。而音频信息隐藏技术将密文信息隐藏在载体音频中,这不仅能隐藏明文的内容,还能隐藏明文的存在,为保密信
去中心化系统是由高度自治的节点自由连接组成的开放式系统。中心化系统存在着中心服务器成本昂贵、过度依赖主干网、单点故障等问题。相比于中心化系统,去中心化系统则具有成本低廉、数据分布式存储且永久保存等优点。但是,去中心化技术带来好处的同时,也面临以下挑战:第一,去中心化系统中节点间物理距离与逻辑距离不匹配,造成数据传输中的带宽浪费;第二,去中心化系统基于内容寻址,数据查询耗时大、效率低;第三,去中心化
互联网技术的发展使得网络信息资源日益庞大。对于用户而言,海量的数据信息严重干扰其对信息的正确选择,因此信息利用率非常低。对于企业而言,满足用户个性化需求对其扩大用户规模具有不可替代的作用。推荐系统可有效解决信息过载问题,提供个性化服务,因此无论对于用户还是企业,个性化推荐系统的研究都具有重要的影响和意义。本文为获得更好的推荐性能,将强化学习方法应用到推荐算法中进行了研究,同时针对企业需求,设计和实
性能测试在通信设备的研发和生产中占据着重要的地位。在5G之前,OTA方法仅被应用于终端性能测试,基站的吞吐率性能通过将同轴电缆连接到基站端口的方式进行评估。对于5G时代的性能测试,由于基站集成度较以往大大提升,只有一体化的测试才能较好的评估其整体性能,传统的传导测试无法满足测试需求,因此对于5G OTA测试的研究,必须同时兼顾终端侧及基站侧。对终端侧的OTA测试,多探头微波暗室法(Multi-Pr
伴随着数字化时代的来临,各种硬件设备不断普及,社会上各大重要场合都安装了监控摄像头,这些监控摄像头组成了一个庞大而严密的监控网络,对企业、公司、社区的安防起到重要作用。目前人脸识别还是社区安防采用的主要技术。在监控场景中,由于光照,角度等问题,不是所有的情况都能拍摄到清晰的人脸,利用人脸识别来查询行人轨迹会导致行人轨迹不完整的情况。近些年比较火热的行人重识别技术是利用行人的图像来识别人物,该技术特