推荐系统中的新用户冷启动问题研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zfzhy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网时代,用户虽可从网络中获取到大量混杂信息,但是用户必须花费大量时间才能获取到有用信息,因此产生了个性化推荐算法。其中协同过滤推荐算法是工程项目实践中使用最普遍的一种,通过对用户的历史行为记录进行分析,建立起用户喜好模型,找出与其相似的邻居用户集合,最终使用相似用户帮助目标用户判断对系统中项目的得分,从而生成候选项目列表并完成推荐。然而在新用户第一次进到系统时,系统此时没有任何关于该用户的浏览记录,无法立即确定与其相似的邻居用户,导致不能为其推荐,从而引起了冷启动问题。冷启动问题会降低推荐的信息质量和准确性,并且也影响用户访问系统的使用体验,因此解决冷启动问题具有重要的意义。为此,设计并实现了一个以用户为基础的推荐系统。系统首先把用户的原始信息预处理成向量集合,生成用户和项目的评分矩阵之后使用主成分分析方法对其进行分解,降低相似度计算的复杂度,然后使用K-means方法将系统中的用户聚类成喜好相似的用户簇,缩小查找邻居用户的范围,最后把用户的个人属性和对项目的评分等信息结合起来共同完成用户相似度的计算并找出最为相似的邻居用户集合,从而判断对项目的得分高低情况,生成候选的项目列表,解决了新用户第一次进到系统时引发的冷启动问题,也改善了系统的准确性。使用真实的用户行为数据集验证所设计系统的性能,并对实验结果进行分析。实验结果充分证明了所设计系统的有效性,相比传统系统也取得了更好的准确性,平均绝对误差降低了约10%。
其他文献
学位
学位
随着物质条件提升,越来越多人开始关注自身的健康和体型。人体体型测量可通过WBX人体扫描仪来实现,但是该设备价格昂贵,无法推广到大众消费市场。基于三维重建技术实现人体体型测量具有成本低、使用场景广的特点。设计并开发了一套基于三维重建的人体体型测量系统。首先通过棋盘标定法标定单目相机;然后使用已标定的单目相机采集不同角度的人体图像,并对这组图像进行预处理;然后使用SIFT(Scale-invarian
OpenStack作为一个开源云平台,具有大规模的服务部署能力,越来越多的服务以容器的方式部署到OpenStack云端。单个OpenStack云往往资源受限,云端管理员需要跨区域扩展多个OpenStack云以满足隔离性、安全性和高可用性等需求。当OpenStack云端用户请求急剧增加时,跨域容器之间如果负载分配不均衡,将会导致云端部分节点过载,进而影响整个跨域云端的性能。此外,跨域多云扩展场景下的
学位
学位
不经意随机访问机(Oblivious Random Access Machine,ORAM)是一种密码原语,它可以消除用户访问内存时轨迹中的信息泄露,隐藏了在不可信环境下用户的访问模式,使得对于任意两个相同长度的逻辑访问序列,客户端和服务器之间的可观察通信在计算上是不可区分的,从而保护数据隐私。然而目前一些效率比较高的ORAM方案一般都有着O(log N)的带宽放大,或者是依靠昂贵的计算开销来实现
为了让计算机理解人类语言,词向量方法将每个单词的语义用一个低维稠密的向量表示,这是自然语言处理领域的一个重大突破。然而,自然语言存在着一词多义现象,词向量方法将单词的多个词义融合为一个向量表示,造成了含义混淆。为了解决这个问题,以单个向量表示词义的词义向量成为近年来一个新的研究方向。构建词义向量首先要获取单词的词义目录,然后生成每个词义的向量表示。当前已有的词义向量构建模型定义的词义目录不够准确,
学位
学位