论文部分内容阅读
随着互联网的快速发展,我们正处于一个信息过载的时代。传统的搜索引擎技术,已经无法满足人们在现如今时代下个性化的信息需求。为了帮助人们有效地筛选大量信息,推荐系统应运而生。现如今,大多数推荐算法是基于显式反馈数据的,对于大量的隐式反馈数据没有很好地使用。在面向ToP-N的推荐场景下,传统算法的思路是基于用户与物品的评分关系做出推荐,而忽视了物品之间的排序关系。因此,本文针对以上两个问题对基于隐式反馈数据的排序推荐技术进行研究,主要工作内容为以下四点:(1)分析和对比基于隐式反馈数据和排序学习技术的推荐算法的优缺点,在此基础上引出了对相关模型和算法的研究与改进。(2)针对现有用户模型中,用户显式属性特征数据稀疏的特点,提出对用户隐式属性特征挖掘的方式,并根据用户的显式属性特征和隐式属性特征构造混合用户模型。首先,就是根据用户的隐式反馈数据并结合物品的社会化标签信息构造用户的描述文档,接着通过LDA主题模型挖掘用户的隐式属性特征。然后,将用户基于显式属性特征的向量空间模型和基于隐式属性特征的主题模型融合,采用用户手工定制建模和自动用户建模相结合的方式建立混合用户模型,并在此基础上提出了一种基于混合用户模型的相似度计算方式。(3)对用户的隐式反馈数据进行个性化处理,分析由隐式反馈数据所表现的用户对于物品的兴趣评级,使ListRank-MF算法能够适用于隐式反馈数据。将基于混合用户模型得到的用户近邻信息融入算法中,使算法既考虑单个用户的物品列表排序信息,同时考虑近邻用户之间的相互影响。(4)对于上述提出的包含用户显式属性特征和隐式属性特征的混合用户模型和基于隐式反馈数据的UNListRank-MF算法进行实验验证。实验结果表明,融合显式属性特征和隐式属性特征的混合用户模型以及改进后的UNListRank-MF算法,可以有效地提高推荐的效果。