论文部分内容阅读
Web技术的快速发展为推荐系统带来了新的问题和挑战:一方面,传统的协同过滤推荐算法已经难以满足用户的个性化推荐需求;另一方面,web技术所带来的海量数据为推荐算法提供了更多有用的信息,如何从这些信息中提取特征并缓解稀疏性、冷启动和动态时效性等推荐系统三大经典问题,有效地提升推荐质量是目前推荐系统算法研究的热点问题。本文针对基于多源数据的推荐问题做了三个方面的深入研究工作:(1)针对实体店铺场景下用户兴趣变化快、缺乏有效的辅助信息以及重复购买三个问题,提出了一套结合用户长期与短期兴趣的推荐算法。通过将图计算与矩阵分解、贝叶斯个性化推荐和张量分解融合的方法分别完成评分预测、物品排序和基于新时间窗的预测;通过挖掘用户室内移动轨迹信息来提取用户行为特征作为辅助信息;设计了启发式规则,通过评分修正来解决重复购买问题。(2)针对现有研究缺乏有效的多源信息融合机制问题,提出了改进的因子分解机模型,通过扩充输入向量域对用户的社交关系和评论信息提取特征并进行融合,解决了将这两类重要辅助信息协同建模的问题。对目标函数进行改进,从实际意义和向量自身结构角度分析并加入社交正则化项和向量域内部正则化项,缓解了过拟合问题。进一步提出深度特征融合模型,使用深度学习方法对输入向量进行重构和特征连接并通过学习得到评分预测,解决了深度学习方法处理多域离散数据的问题。(3)提出基于多源隐式反馈数据的三种推荐算法:针对基于物品相似度聚合的预测模型表达能力不足的问题,提出了因子化的物品相似度和用户相似度聚合打分的方法,使模型具有更好的解释性和表达性;针对电子商务场景下用户短期偏好为主导的个性化推荐问题,提出了带有时间衰减因子的全局打分函数,解决了多类型隐式反馈数据的建模问题,提出了针对用户个性化排序的约束采样方法,解决了隐式反馈中负反馈的处理问题;针对隐式反馈信息中确定性反馈和非确定性反馈信息缺乏协同建模的问题,提出通过利用两个协同矩阵分别对确定性隐式反馈和非确定性隐式反馈信息进行聚合计算并在目标函数中加入约束项,解决了两类隐式反馈信息协作建模的问题,使模型具有较好的表达能力和实际意义。通过大量真实数据集上的实验测试表明,相比经典的和目前主流的baseline算法,本文所提出的方法具有更高的推荐质量。