融合社区发现的混合推荐算法及其在音乐数据上的应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:DSFDSAF
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代背景下,网络上的信息量呈爆炸式增长。丰富的信息资源为人们提供了诸多便利,同时产生的信息过载问题也增加了用户获取真正感兴趣信息的难度。为了解决用户的有限需求与海量数据之间的矛盾,推荐系统应运而生。其中协同过滤推荐算法作为应用最为广泛的推荐算法之一,凭借其优秀的推荐质量,获得了众多学者的青睐。传统的协同过滤推荐算法根据用户历史行为数据挖掘用户偏好,通过寻找与目标用户相似度较高的用户群体,计算目标用户对项目的预测评分。但在实际应用中,由于用户与项目数量的规模激增,数据的稀疏性问题、冷启动问题也随之暴露出来。本文则针对上述问题,对传统的协同过滤算法进行了深入研究,提出了一种融合社区发现的混合推荐算法,简称HRA-CD算法。本文的主要研究内容如下:1.传统的基于用户的协同过滤算法仅根据历史行为数据计算用户相似度,忽略了社交因素对推荐产生的影响,因此首先利用用户间好友关系,对用户-项目稀疏评分矩阵进行部分填充,一定程度上缓解了数据稀疏性造成的相似度计算偏差;其次,建立用户社交关系网络,通过简单的社交网络分析定义用户间社交关系强度,加入社交因素对传统的基于评分的用户相似度进行改进,提高了用户相似度计算的准确性,有效改善了推荐质量。2.针对传统的基于项目的协同过滤算法中类似的相似度计算问题,通过利用项目的基本属性特征,构建空间向量模型,定义项目的属性特征相似度并对传统的基于评分的项目相似度进行改进,一定程度上解决了项目的相似度计算问题与冷启动问题。3.传统的协同过滤算法仅使用相似度排序作为最近邻用户或项目的挑选依据,忽略了用户或项目相似度网络中的关系传递性。使用复杂网络中的社区发现算法对网络中联系紧密的节点进行社区划分,提出用户推荐群与项目相似群的计算方法,以此作为最近邻用户或项目的候选集合。融合以上改进,结合基于用户的协同过滤与基于项目的协同过滤进行混合推荐。4.在Last.fm与MSD两个音乐数据集上进行了对比实验,选取最优参数取值,与传统的协同过滤算法在常用的评估指标上进行对比,验证HRA-CD算法的有效性。5.以HRA-CD算法为核心,将其应用于音乐推荐中,使用SSM框架与MVP框架设计并实现一个线上音乐推荐系统。
其他文献
氢气因其可再生、能量密度高和燃烧产物无污染等优点,被称为是21世纪最有潜力的清洁能源。其中,电解水是低成本制备高纯度氢气最有效的方法之一。水的电解包括阴极的析氢反应(HER)和阳极的析氧反应(OER)。由于OER涉及多电子转移过程,过电势较高,极大的限制了水的分解速率。因此,设计制备高效、稳定和廉价的水氧化催化剂是提高电解水制氢最有效的途径。钴(Co)基材料因其优异的OER性能而受到研究人员的广泛
作为当今世界第二大经济体,中国在全球贸易、军事、科技、文化等领域都占据着极其重要的位置,各国与中国进行合作交流已成为全球趋势,汉语在世界语言中的重要性日益显著。“汉语热”潮流的形成促使汉语国际教育事业蓬勃发展,越来越多的志愿者赴任国外教授汉语,成为对外汉语教学的中坚力量。泰国是汉语教学浪潮中走在前沿的国家之一,学习汉语的人数位于全球前列,而其汉语教学的质量与效率却并不能满足大量学习群体的需求,如何
随着工业的快速发展,人口的急剧增多,传统化石能源已经不能满足人类的需求,能源安全与环境问题日益突出,实现能源高效、清洁的转化成为当前研究的热点。直接醇类燃料电池是将
遥感技术广泛应用在地质、农业、海洋等领域,已经成为了分析宏观地理信息的主要技术。随着时间推移,同一个区域的地表覆盖物很可能发生变化,而这些变化往往是需要重点关注的对象。遥感图像的变化检测就是指,对于同一地区不同时期的遥感影像和相关数据,运用图像处理与数学模型技术来比较、分析并且判断图像之间的变化,该方向是当前遥感研究的热点。随着深度学习的兴起,近几年来基于深度学习的变化检测方法成为了该方向新的研究
卫星通信由于具有覆盖面积广泛、限制小、易于实现多址传输、能迅速建立通信链路等诸多优势,成为各国军事通信系统中的重要组成部分。传统的卫星隐蔽通信一般采取扩频的方式隐藏信号,使用扩频码对信号进行频谱扩展,然而在寻求性能优、数量多的扩频码方向仍存在很大问题,混沌理论为扩频码的研究领域点明新方向,成就现在的混沌扩频通信。非平稳通信是通信领域的另一个新思路,从概率学和统计学的角度看,不管是传统的扩频通信还是
传统可靠性的研究主要是运用基于概率和统计模型的随机可靠性方法进行分析,这种方法需要大量的样本数据来建立具有精确参数的寿命分布。然而,由于系统工作环境以及其它不确定因素,可能导致无法精确估计系统的寿命分布参数。鉴于此,本文将部件寿命分布参数看作不确定变量,将部件寿命假定为随机不确定变量,运用概率论和不确定理论作为数学工具分析系统可靠性。首先,基于概率论和不确定理论,运用机会测度定义了随机不确定不可修
随着现代无线通信技术的高速发展,码分多址技术因其能有效利用频谱资源而获得广泛应用。码分多址通信系统采用扩频码通信技术,其通信系统的性能和扩频码的选择有重要关系,采用具有理想特性的扩频码不仅能够有效提高频谱利用效率,还能够有效降低系统复杂度。近年来提出的基于完全互补码的码分多址系统,采用完全互补码作为扩频码,依靠完全互补码的理想相关特性,有效提高了基于完全互补码的码分多址系统的扩频效率和带宽利用率,
随着社会的进步和科技的发展,应用场景逐渐多样化,人们更加需要同时具有波束自动跟踪能力和一定隐身能力的高性能天线来实现更丰富的功能。Van Atta天线阵列作为方向回溯阵列天线的一种,具备方向回溯特性的同时,还可以实现对雷达散射截面的控制,在保证工作性能的前提下,提高隐身性能。但如果来波方向与阵列之间的角度过大,会导致回溯波无法准确沿入射波方向发射,性能急剧下降。因此,回溯角度是重要性能指标之一,宽
人类眼球所处的状态和运动轨迹称为眼动信息,眼球运动的信息与人类心理、行为特征都有紧密关联,能实时地反映人类的心理变化及意识倾向。目前最为常见的是基于PC机的眼动检测
C-H键官能化反应是一种通过活化C-H键实现官能团直接引入的方法,近年来被广泛应用于C-C/C-X(X=C,N,S,O等)键的构筑。C-H键的直接官能化可实现目标分子的一步合成,避免对底物的预官能化反应,减少了化合物的合成步骤,提高反应的原子经济性。将C-H官能化方法应用于构建活性中间体的先导骨架,合成具有多样活性的化合物或者具有成药潜力的化合物,对于药物化学领域的研究具有重要意义。芳基甘氨酸及氨