利用交叉推荐模型解决用户冷启动问题

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:Ipomoea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户冷启动是推荐系统的一个重要问题,传统的推荐系统使用迁移学习的方法来解决这个问题,迁移学习是指利用信息丰富领域的知识解决信息稀少领域的数据稀疏问题,将迁移学习和推荐系统相结合是指利用评分信息丰富的领域的知识预测另外一个领域的用户对物品评分。上述迁移学习模型假设两个领域没有重叠的用户和物品,如果两个领域没有共同的标签信息,则利用评分较为丰富的领域获取用户群和物品群之间的关系,然后将该关系迁移到评分稀少的领域中,解决评分稀少领域中的数据稀疏问题,如果两个领域有共同的标签信息,则利用评分丰富的领域获取标签的隐含特征,然后将标签的隐含特征迁移到评分稀少领域中,解决数据稀疏问题。  与上述假设不同,很多情况下系统可以获取同一用户在不同领域的数据。针对这种数据,提出一种新的推荐系统冷启动模型-crossSVD&GBDT(CSGT),通过有效利用重叠用户的信息来解决用户冷启动问题。具体地,首先提出新模型获取用户和物品的隐含特征,然后利用用户和物品的一部分隐含特征构造训练集,最后利用GBDT模型进行训练,并利用训练后的模型预测结果。实验数据表明,在豆瓣数据集中corssSVD&GBDT可以得到比传统方法性能更高,鲁棒性更强的实验结果,尤其是MAE的评价指标高出一般方法很多。本文将该模型实现成一个自动化工具,用户只需输入定义好的训练集格式和参数,即可得到预测集的结果。最后本文描述了进一步的研究,在当前数据的基础上,引入物品标签信息,利用两个领域重叠的用户和标签解决数据稀疏领域中的用户冷启动问题。
其他文献
学位
Linux是UNIX系统的克隆。目前,Linux的安全性用TCSEC标准来衡量的话,大致处于C2级。设计中所违背的一系列安全原则使得Linux面临着诸如SETUID问题、口令问题、特洛伊木马问题等
学位
在实际应用中,卫星通信系统存在着时延大、误码高、非对称等传输特性,造成了卫星TCP性能低下。如何改善卫星TCP的传输性能是一个被广泛重视的问题。目前,在对卫星TCP的性能进行
学位
非关系型数据库(NoSQL)是一项具有许多吸引人的特性的新兴技术:具有横向扩展能力,能够跨多个服务器复制和分区数据,并且具有灵活的模式结构,因此可以管理高度非结构化的数据。此
虚拟计算模式是继基于大型机的集中式计算模式和基于PC机的分布式计算模式之后的一种新型计算模式,兼具前两种计算模式的优点,并在很大程度上回避了它们的缺点,因而近年来获
语义Web的设计目标是能够开发出标准和技术,以使得机器能够理解Web上更多的信息。描述逻辑方法是语义Web中需要研究的重要部分。本论文试图对该问题进行较深入的研究。主要研
学位
随着网络技术的飞速发展,网络安全问题日渐严重。由于数据库中数据大量集中存放,且为众多用户直接共享,安全性问题更为突出。本文在分析数据库的安全威胁和安全需求基础上,重点从
学位
随着面向服务体系结构(SOA,Service-OrientedArchitecture)的广泛应用,企业的业务过程也逐渐变得越来越面向服务。由于服务既是业务层的概念又是技术层的概念,因此大大降低了业
学位
XML(可扩展标签语言)已成为当前基于网络应用的数据表达、交换的标准,设计并实现针对XML数据的有效管理机制也就成为几个相关研究领域所关注的热点,例如数据库领域,Web服务,电子
随着社会经济水平的发展,现在人们生活追求个性化、自动化,追求快节奏,追求充满乐趣的生活方式,生活家居要求一种人性化、智能化。特别是计算机技术、网络通信技术、信息控制技术