基于主题模型和用户相似度的推荐算法研究

来源 :广州大学 | 被引量 : 0次 | 上传用户:xiaoxiaodeai1002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪后,计算机技术取得了飞速发展。目前人们的工作、学习、信息获取等诸多方面都与互联网密切相关。互联网的普及让生活变得便利的同时,也带来了信息过载等问题。推荐算法有效地缓解了这个问题,可以为用户推荐其感兴趣的信息。本文同时考虑单个用户兴趣偏好和用户之间互相影响的因素,提出了基于主题模型和用户相似度的推荐算法,主要工作包括:(1)提出了基于主题模型和用户相似度的推荐算法。算法使用LDA(Latent Dirichlet Allocation)主题模型,生成用户对物品的偏好概率矩阵。根据用户特征对用户进行聚类,计算用户间的权值。将用户偏好信息与用户间的权值相融合,计算出用户对物品的最终偏好,产生推荐结果。对比已有的推荐算法,本算法在召回率和精确率等指标上都得到了提高,并降低了算法在数据稀疏性问题上的求解难度。(2)提出了利用用户分组信息计算用户间权值的方法。方法根据用户使用标签的数据将用户进行聚类,把具有相似偏好的用户划分到同一个群组中,并依据用户分组信息计算用户间的权值。用户偏好会随时间推移发生变化,方法根据用户标记物品的时间,计算基于时间的用户相似度。方法将用户分组信息权重和相似度信息相融合,得到用户间的最终权值。(3)提出了基于标签挖掘用户兴趣的方法。方法利用LDA主题模型对用户-标签数据和标签-物品数据分别进行处理,将标签中语义信息融入用户和物品二元数据中,得到用户对物品的偏好概率。方法将用户间的权重和用户的物品偏好信息相融合,模拟用户互相影响的过程,得到用户对物品最终的偏好情况。该方法对比仅考虑用户的评分信息和标签数量的传统方法,更好的挖掘了用户的潜在兴趣。本文使用了推荐算法领域内常用的Last.fm数据集进行了实验,根据用户感兴趣的音乐流派为其推荐歌手。实验结果显示本文提出的推荐算法在音乐领域有良好的效果,能优化用户的使用体验。
其他文献
心血管疾病是威胁人类健康的元凶之一,如何消除心血管疾病的危害是世界医学领域关注的重要问题之一。传统的插管治疗,会给患者带来极大痛苦,微创手术凭借创伤小、术后易恢复等优点成为医学研究热点。而将微创手术与血管机器人结合应用于人体治疗,逐步成为医学界研究主流趋势,具有极大应用潜力。本文对外磁场驱动螺旋血管机器人进行研究,为解决血管机器人驱动问题,文中采用一种较安全的三轴亥姆霍兹线圈作为磁驱动模块,综合考
联邦学习通过对分布在多方用户本地的数据进行协作学习,可以有效解决数据“孤岛”问题。在联邦学习训练过程中,用户之间只需要通过模型参数信息或者梯度信息来进行交互学习,而不直接接触其他客户端本地私有的数据。然而,联邦学习仍面临一系列的安全与隐私挑战,包括数据的成员推理攻击、模型窃取与投毒攻击等。本论文针对联邦学习中的数据隐私问题进行研究,由于联邦学习中用户需要在本地训练并将模型参数提交给服务器聚合,从而
随着科学与技术发展,云计算引起各行业学者广泛关注。云计算资源调度问题逐渐多机器化与多阶段化。如云计算模型中数据可由多个服务器传输,并且数据传输路径是可分为两阶段,外存储器传输至云服务器,云服务器经过网络传输给用户,该模型是典型的多机器环境下的两阶段调度问题。目前,国内外对于多机器环境下的两阶段调度问题主要的研究目标为最小化最大完成时间,而以最大收益为目标的研究少之又少。因此本文将研究多机器环境下两
在机器人抓取的研究领域中,生成待抓取物的抓取位姿是关键环节,如何在不同场景下稳定地生成精确抓取位姿是该领域研究的一个核心问题。本文将基于深度学习理论的目标检测算法Faster R-CNN应用到待抓取物检测环节,并利用数字图像处理与抓取时力封闭的思想,提出一种面向二指末端夹持器的抓取位姿计算方法,通过实际抓取实验验证了整个系统的抓取效果。本文使用Faster R-CNN目标检测算法对待抓取物进行位置
比特币的火热使其背后的区块链技术逐渐走入人们的视野,其去中心化的思想收获了大批拥护者,吸引着大批学者和技术人员对区块链展开研究。但万物皆有两面性,区块链技术中让所有人参与并维护公共账本的关键特性也隐藏着弊端,即泄露用户隐私的问题。在区块链网络上,交易数据公开透明地暴露在其他人面前。为了保持交易中的隐私和机密性,同时仍然保持数据的不变性,本文在分析了现有的区块链隐私保护技术的基础之上,提出了一种基于
手术机器人在骨科上的应用是最具发展前景的技术之一。随着X射线、CT等医学造影技术的飞速发展,骨科疾病的诊断变得越来越容易,随之而来的便是针对不同种骨科疾病的治疗。近年研究人员开始针对不同的骨科疾病研发手术机器人,但是针对骨肿瘤疾病的手术机器人,采用影像引导机器人的方式进行骨肿瘤手术切除还没有人关注。这种方式具有微创的优点,这个优点既可以减轻患者的痛苦,也可以缩小患者的创口面积。本文针对影像引导的骨
当前,万维网上的大多数资源信息可以供人类阅读,但是,为了使软件可以理解和调用万维网上的信息和服务,需完成从当前万维网到语义网的转换。万维网上的大量数据仍存储在关系型数据库中,造成大量数据的语义无法精确定义。本体数据集作为语义网数据一种数据范例,定义了数据的语义,并致力于增进各类系统之间的数据同享。同时,随着人工智能和深度学习的高速发展,众多智能化系统被设计开发出来。然而,大量电商领域的客户服务仍主
全局光照一直是图形学和游戏领域研究的难点和热点,也因为相关技术突破的难度较大、应用价值较高使之一直是图形学和3D游戏领域的研究热点。真实感和实时性是渲染技术追求的两大目标,难以兼得,不同算法往往根据渲染场景及侧重目标在二者之间实现最佳平衡。本文主要关注基于体素的圆锥追踪技术的实时全局光照算法以及基于光切的多光渲染算法。主要研究工作包括以下三个部分:1.实现一种基于动态的实时全局光照算法—基于体素的
当今社会,复合加工技术飞速发展,在复合加工领域,车铣复合加工技术是发展最为迅速的一门技术,相比较于传统的车床加工,车铣复合技术增加了旋转轴如绕X轴旋转的A轴,因此车铣复合不仅可以实现车削加工,也可以实现铣削加工,从而实现了联动加工。木工车铣复合具有多种优点,其调节速度快、加工时间短、加工效率高、一次装夹可实现多个面加工,因此木工车铣复合加工能完成多种多样的加工任务,实现三维立体化生产,车铣复合加工
硅钢是一种含碳量很低的硅铁软磁合金,已被广泛应用在电气元件的芯部部件上。由于轧制过程形成的各向异性使硅钢板在后续二次成形,特别是在冲裁过程中发现毛刺较大且有时冲裁圆形度不够等问题,一定程度上降低了硅钢片生产效率和质量。为此,本文以典型的冷轧无取向硅钢50W800为研究对象,利用组织性能测试和有限元数值分析手段研究其各向异性性能及其对冲裁过程的影响规律。本文主要研究内容及结论如下:(1)针对冷轧无取