基于多源数据的协同过滤推荐算法研究

来源 :上海交通大学 | 被引量 : 3次 | 上传用户:YOLANDA123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web技术的快速发展为推荐系统带来了新的问题和挑战:一方面,传统的协同过滤推荐算法已经难以满足用户的个性化推荐需求;另一方面,web技术所带来的海量数据为推荐算法提供了更多有用的信息,如何从这些信息中提取特征并缓解稀疏性、冷启动和动态时效性等推荐系统三大经典问题,有效地提升推荐质量是目前推荐系统算法研究的热点问题。本文针对基于多源数据的推荐问题做了三个方面的深入研究工作:(1)针对实体店铺场景下用户兴趣变化快、缺乏有效的辅助信息以及重复购买三个问题,提出了一套结合用户长期与短期兴趣的推荐算法。通过将图计算与矩阵分解、贝叶斯个性化推荐和张量分解融合的方法分别完成评分预测、物品排序和基于新时间窗的预测;通过挖掘用户室内移动轨迹信息来提取用户行为特征作为辅助信息;设计了启发式规则,通过评分修正来解决重复购买问题。(2)针对现有研究缺乏有效的多源信息融合机制问题,提出了改进的因子分解机模型,通过扩充输入向量域对用户的社交关系和评论信息提取特征并进行融合,解决了将这两类重要辅助信息协同建模的问题。对目标函数进行改进,从实际意义和向量自身结构角度分析并加入社交正则化项和向量域内部正则化项,缓解了过拟合问题。进一步提出深度特征融合模型,使用深度学习方法对输入向量进行重构和特征连接并通过学习得到评分预测,解决了深度学习方法处理多域离散数据的问题。(3)提出基于多源隐式反馈数据的三种推荐算法:针对基于物品相似度聚合的预测模型表达能力不足的问题,提出了因子化的物品相似度和用户相似度聚合打分的方法,使模型具有更好的解释性和表达性;针对电子商务场景下用户短期偏好为主导的个性化推荐问题,提出了带有时间衰减因子的全局打分函数,解决了多类型隐式反馈数据的建模问题,提出了针对用户个性化排序的约束采样方法,解决了隐式反馈中负反馈的处理问题;针对隐式反馈信息中确定性反馈和非确定性反馈信息缺乏协同建模的问题,提出通过利用两个协同矩阵分别对确定性隐式反馈和非确定性隐式反馈信息进行聚合计算并在目标函数中加入约束项,解决了两类隐式反馈信息协作建模的问题,使模型具有较好的表达能力和实际意义。通过大量真实数据集上的实验测试表明,相比经典的和目前主流的baseline算法,本文所提出的方法具有更高的推荐质量。
其他文献
十八届三中全会提出了关于"以管资本"的国有资产管理视角,进一步突出了国有资产改革工作的重点,本文基于这一问题,针对以管资本为主的国有资产监管体制的应用进行分析。
<正>德国农村土地证券化制度概述在18世纪中晚期的德国,为了整顿处于崩溃边缘的农业经济,规范农村经济运行秩序,最大可能减少战争对农业经济主体的直接冲击,政府开始向农村大
使用Web文本挖掘技术,结合核密度估计法、词频统计法、关键词权重分析等方法对8290条招聘信息进行提炼分析,从涉及高等教育结构与产业结构的月薪、学科专业、地区分布、学历
目的观察水飞蓟宾胶囊治疗单纯性脂肪肝的临床治疗效果。方法将40例单纯性脂肪肝患者随机分成四组,每组10人,投入到四种治疗方案中,分别于第8w、12w、24w检测ALT、AST、γ-GT
在水生态修复过程中,为了合理使用草爽II代杀灭水绵提供必要的基础参数范围,用草爽II代研究其对水棉生长的抑制效果以及对水生植物及动物的影响作用。结果表明:草爽II代对水
目的:通过检测家兔腹肌肌膜表面微循环血液灌流量的变化,探讨高压电烧伤对腹壁骨骼肌微循环的影响,为临床防治高压电外周肌肉组织损害提供实验依据。方法:选择72只健康家兔,
会议
从各大词典对"而且"的释义着手,发现各大词典对其的释义存在分歧。通过对"而且"的义项、表示的语义关系、语义预设、连接模式以及连接的成分类型进行分析,发现"而且"不但可以
目的探讨酮咯酸氨丁三醇不同给药途径对四肢骨折患者镇痛效果、起效时间、不良反应的影响。方法选取2014年3月至2017年3月在我院骨科行内固定术的四肢闭合性骨折患者98例进行
<正>如何让孩子们幸福、健康、快乐地成长是广大幼儿教师和家长及社会所关注的问题。孩子像小树一样,在成长的过程中要勤修枝剪杈、认真呵护,不能肆意虐待。然而在幼儿教育中
饮用水源地环境保护工作直接关系到广大人民群众的身体健康和经济社会的可持续发展。文章在宁德市中心城区集中式饮用水源地水质现状监测数据基础上,从水源地基本情况、水质