利用矩阵分解算法建模数据稀疏环境下用户协同行为

来源 :杭州师范大学 | 被引量 : 4次 | 上传用户:wanyuequn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年来社交媒体的流行,信息的产生、传播、分享变得越发容易。人们只需要通过发布微博,更新自己的社交状态就能同来自世界各地的人们通信,交朋友,甚至进行商业贸易。电子商务的盛行,网络购物正逐渐地成为人们生活中不可或缺的一部分,也在颠覆着传统的产业结构。然而,人们在受益于信息爆炸所带来的便利的同时,也在面临信息过载所带来的困扰:该如何从庞大的信息池中获取有价值的资源呢?推荐系统的出现正是为了解决这个问题,也在逐渐成为很多商业应用的重要组件,自动地通过分析用户偏好,为人们推送最为喜欢,符合个人口味的信息。本文主要探讨推荐系统研发过程中所面临的数据稀疏性问题,并从评分预测和排序预测的角度探讨了如何设计缓解该问题的个性化算法。本文的主要贡献如下:1.探讨了如何利用矩阵分解算法刻画用户评分决策过程,从反馈数据中进一步捕捉用户与物品以外信息的交互作用,缓解显性评分反馈不足所带来的预测缺陷,并设计了相应的实验。2.研究如何利用排序学习解决比传统协同过滤数据稀疏性更为严重的,需要处理三元张量关系的协同检索任务。在两份真实数据集的结果显示,我们提出的算法能够有效提升预测准确度,尤其是对那些信息含量很少的物品。3.为Pairwise排序学习在推荐算法的应用提出了一种基于物品的采样策略,并进一步定义了一种自适应采样策略,提高了采样效果的同时,也改善了Pairwise算法在稀疏数据上的预测准确率。
其他文献
谱聚类算法是一种经典的聚类分析方法,与传统的聚类算法相比,它具有在任意形状的样本空间中聚类且收敛于全局最优解的优点,非常适合于许多实际问题,所以一直是机器学习领域中研究
数据库技术的迅速发展和广泛应用导致了“数据爆炸而知识贫乏”的现象。如何从现行管理信息系统大量的业务数据中抽取有用的知识,以辅助企业决策层进行管理决策,是企业的愿望,也
随着计算机技术的飞速发展,人们为了充分利用广域网上的分布式资源,提出了网格计算的概念。网格计算是分布式计算的一种,其目的是建立大规模计算和海量数据处理的通用基础支撑结
随着计算机网络技术的快速发展,网络安全问题越来越受到人们的重视。入侵检测技术作为一种主动的安全防护技术,能够及时地检测到各种恶意入侵并进行响应,入侵检测系统已成为
脉冲耦合神经网络(Pulse coupled Neural Network,PCNN)是被称为第三代人工神经网络的新型神经网络模型。它具有生物学背景,是在研究哺乳动物视觉皮层脉冲震荡现象的基础上提
RS与GPS为空间信息的采集提供了技术支持,GIS从定量的角度建立了空间信息处理与应用的理论和技术体系。但是,空间信息是复杂的,从量上来看是海量级的;从种类上看不仅包含数值
随着互联网的普及,电子邮件以其快捷、方便的特点已成为互联网上最重要的应用之一。但垃圾邮件也越来越泛滥,占用了有限的存储、计算和网络资源,耗费了用户大量的处理时间,影
业务管理是电信网络管理的重要内容,是推动信息技术发展的重要驱动力。对于QOS的管理,是对业务全面有效管理的核心内容,也是促进下一代运营分析支撑管理系统发展的重要环节。
嵌入式系统中图形图像的加速技术在工业、国防和人们的日常生活中有着广泛的应用。然而,目前常用的嵌入式图形加速系统仍存在一些不足,如嵌入式微处理器负担过重,移植性不强,
随着Web信息的爆炸性增长,如何快速、准确地从浩瀚的信息资源中寻找所需信息已经成为困扰人们的一大难题。传统搜索引擎技术满足了人们一定的需求,但由于其通用的性质,仍然不能