基于机器学习优化用户音乐喜好个性化推荐的研究

来源 :广东工业大学 | 被引量 : 4次 | 上传用户:c2825015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网信息的飞速发展和音频视频压缩等技术的出现,使得数以亿计的用户可以访问各式各样的资源。在信息爆炸的时代,内容提供商需要解决如何有效地向用户推送符合用户喜好信息的问题,推荐系统因此应运而生。推荐系统是一种信息过滤系统,通过从大量数据集中过滤多余信息的方法,利用算法精确定位用户的偏向喜好,向目标用户推荐其可能喜欢的新的相关内容。其中,推荐系统的一个重要应用就是音乐推荐系统。推送的结果好坏不仅决定了用户使用体验度,也是衡量一个音乐资源提供商实力的标准,并且也很大程度地推动了音乐文化的发展。现有的音乐推荐系统方法还过于单一,收集的大量用户行为数据的价值没有被充分挖掘利用,推荐效果还有待提升。另外每个音乐用户都有属于自己的私人歌单,歌单中的歌曲呈顺序排列,如何把这种上下文关系与推荐算法结合起来也是一个有待解决的问题。机器学习是一门近几年来研究的热点,在银行、保险、交通、生物、医学等领域有着十分广泛的应用。而将机器学习算法应用到音乐推荐领域可以充分地挖掘数据价值,更好地为用户提供服务,提升平台实力,推动音乐文化的发展。机器学习算法种类繁多,不同的算法在不同的数据集上的效果不相同,对不同的算法的优缺点进行对比分析,完善现有音乐推荐系统是非常重要的事情。本文结合目前国内外的研究成果,分类概述了目前几种主流的音乐推荐方法:基于内容和协同过滤推荐,以及两者的加权混合模型。本文对Spotify提供的音乐数据集进行研究,用Word2vec编码方式代替One-hot编码,建立了歌曲之间的上下文联系并解决了维度过高的问题,用XGBoost对特征权重进行选择,对特征进行分类,对比各种加权方法的优劣,通过协同过滤算法,XGBoost模型、LightGBM模型和基于Word2vec特征的组合模型对用户是否会在接下来30天内再次听目标歌曲进行预测,从衡量推荐准确度的评价指标AUC入手,对预测结果进行分析评价,对比评估本文提出的新的预测方法在用户是否会再次听歌问题上的预测性能。实验结果证明,基于Word2vec特征的组合模型预测方法预测准确度高,能够更好地利用类别信息,有效提高预测模型的鲁棒性以及弥补了机器学习技术在音乐推荐领域的应用不深的状况,这是一种非常适合用于音乐推荐相关问题的方法。
其他文献
近日,少卿托人把他新画的一批仕女、观音、罗汉作品给我看。让我眼前一亮!感叹他勤奋作画、善于创新之余,一股雅逸清秀之风扑面而来!随后少卿打来电话,请我写几句评论,我欣然
反复呼吸道感染(RRTI)主要指1年内上、下呼吸道感染的次数频繁的一种临床综合征。本病的年龄因素比较突出,据统计6岁以下儿童RRTI发病率在9.0%~13.3%之间,严重影响小儿生长发
柴达木盆地的钾矿资源占全国探明储量的90%以上,近年来在柴达木盆地西部大浪滩北部地区发现了以砂砾石为含卤介质的深层孔隙卤水.文章通过分析柴达木盆地盐湖的形成过程,说明
F14是一株用原生质体融合技术构建的能够降解多环芳烃(PAHs)的融合菌株,利用生物质炭固定化F14制备固定化微生物小球来提高该菌株对芘的去除能力。实验在确定聚乙烯醇(PVA)和海藻
目前,越来越多的城市、公司、协会,还有各种赛事、活动都会设计属于自己的吉祥物。设置这些吉祥物最基本的目的就是与公众互动,但当它们进入公众视野时,却常常出现很多"失控"
<正>在全国宣传思想工作会议上,习近平总书记提出了举旗帜、聚民心、育新人、兴文化、展形象的使命任务,强调统一思想、凝聚力量是宣传思想工作的中心环节,为做好新形势下宣
大浪滩盆地是柴达木盆地西部的一个次级盆地,以新生界沉积为主,蕴藏着丰富的盐类矿产资源。本文从卤水钾矿的分布上、含钾卤水地层的岩性、水文地质、水化学及主要组份含量方
<正>Akzo Nobel公司投资扩建有机过氧化物装置总部设在荷兰的Akzo Nobel公司称,它计划投资2 000万欧元扩大其在比利时Mons和美国得州Houston的有机过氧化物装置产能。在Mons
党的十八届三中全会《决定》提出了“提高文化开放水平”的重大任务,同时强调“切实维护国家文化安全”。如何认识文化开放与文化安全的关系,并在文化开放中维护文化安全,是在全
报纸
近年来,随着海水养殖业的迅猛发展,我国沿海水域生态系统遭受了不同程度的污染。选取我国沿海10个典型养殖水域(大连、唐山、蓬莱、连云港、启东、象山、宁德、东山,湛江、陵