论文部分内容阅读
随着行业数据的急速增长,推荐系统成为用户获取有用信息的必要工具。通过分析用户历史行为信息,有效挖掘用户偏好模式,实现不同情境和不同任务需求的推荐。针对个性化推荐的研究不仅对用户获取有效信息具有重要的指导意义,同时也具有重要的商业价值,高效的推荐能够有效提升在线服务的市场价值,甚至对社会发展和国家安全具有重要意义。此外,推荐系统相关理论与方法的研究结合了不同学科不同分支,对不同学科的发展起到了促进作用,同时也是产学研相结合的典型代表,有利于促进产业与科研的相互配合,体现综合优势。推荐系统如此重要的同时,也面临着诸多挑战。虽然互联网平台用户量与物品量均以千万甚至亿计,然而针对单一用户,其交互行为常常只占庞大用户物品潜在交互可能中的极其稀少的一部分,从而导致了严重的数据稀疏性问题。此外,即使用户仅仅与少量的物品存在历史交互行为,由于不同物品类别各异,用户偏好也常常呈现出多样性态势,而现有多数推荐方法无法有效刻画用户多样化的兴趣偏好。最后,推荐系统的可解释性是现有仅关注推荐精度的方法所缺乏的,可解释结果不仅能够增强用户的信任,也能为模型设计人员提供改进方向。因此,有效处理数据稀疏带来的挑战,同时针对多样化的用户偏好模式进行建模,实现推荐结果的可解释仍然是现有推荐系统研究的重点。本文针对推荐场景存在的数据稀疏性、偏好多样性以及模型可解释性问题,从主体偏好模式、社交偏好模式、多样性偏好模式和可解释偏好模式四个方面出发对生成式推荐模型进行研究,主要贡献如下:1.主体偏好模式挖掘:生成式推荐模型的核心主要关注用户偏好表示,然而高度稀疏的用户物品行为信息为用户偏好学习带来了挑战。本文提出从用户行为数据特点出发的深度生成排序推荐模型DGR,有效结合了生成式模型灵活性与神经网络强特征表达能力,实现稀疏用户行为数据的有效建模。具体来说,通过定义适用于稀疏数据的贝塔-伯努利生成过程,结合行为数据生成的point-wise重构机制与行为数据偏序对关系的pair-wise排序机制共同实现用户偏好学习。point-wise重构机制致力于对用户偏好行为数据进行重构,而pair-wise排序机制考虑用户行为数据中的正负反馈信息实现偏好正负建模。此外,从理论层面对整体生成模型泛化误差进行分析,保证了模型的有效性。在四个真实数据集上的实验结果表明,DGR模型能够建模稀疏用户行为数据,并有效提升在冷启动用户层面的预测精度。2.社交偏好模式挖掘:稀疏用户行为信息带来的挑战,能够通过有效引入额外信息进行缓解。社交网络作为一种独特的用户信息,有效刻画了不同用户间的关联性。本文提出结合间接社交关系的概率矩阵分解社交推荐模型In SRMF,有效实现了用户社交偏好与行为偏好的统一学习。具体而言,提出泊松-伯努利生成过程对简单二值社交关系的内在关联关系进行建模,其中借助泊松分布离散特性,有效刻画了用户间的潜在社交强度。社交数据生成过程能够与用户偏好数据生成过程有效融合。优化层面,提出基于图计算的并行计算框架实现模型变量的高效求解,使模型适用于大规模推荐数据集。最后,从不同角度展示了模型在真实社交推荐数据集上的有效性。3.多样性偏好模式挖掘:尽管大规模用户量和物品量的增加加剧了用户交互行为的稀疏性,但同时也带来了用户偏好的多样化,尤其是当物品种类呈现丰富性时。针对用户偏好多样性学习,本文从传统贝叶斯生成模型和深度生成模型角度,引入自适应学习机制构建不同偏好用户群体的最优表示,同时引入全局偏好学习共同挖掘用户内在多样性偏好模式。具体来说,本文提出了面向评分预测的自适应局部矩阵近似推荐模型ALo MA,通过有效结合自适应局部子矩阵学习,局部子模型最优秩学习以及稀疏数据非随机缺失机制实现用户偏好多样性建模。提出吉布斯采样的高效推断算法实现模型高效求解。同时,为了结合深度神经网络非线性特征表达能力,本文提出结合全局与局部表示的深度生成式推荐模型DGLGM,通过引入非参数化狄利克雷先验,有效实现用户群体自适应划分。为了有效缓解变分推断优化算法带来的模型误差,引入局部变分优化策略,有效提升模型证据下界,并从理论层面与实践层面确保了模型的有效性。4.可解释偏好模式挖掘:推荐精度的提升并不一定能够带来用户满意度的提升,模型可解释不仅让用户对推荐结果更加信服,也能帮助模型设计人员明白模型内在运行机理,准确优化模型。针对现有传统生成式推荐模型与深度生成推荐模型,本文提出面向数据层面和特征层面的可解释生成机理,实现模型可解释。具体来说,针对概率矩阵分解模型可解释性低等问题,提出度量用户历史行为重要性的影响力机制模型In2Rec,实现用户预测结果可解释、可溯源。此外针对稀疏离散化评分数据,提出离散化高斯分布有效刻画不同评分值拟合过程,通过结合非随机缺失机制,实现对稀疏数据内在生成机理的描述。In2Rec能够通过提出的迭代条件模式算法高效求解。同时,针对深度生成模型可解释性建模In DGRM,提出稀疏因子映射机制,有效关联不同隐表示因子与物品组的关系。此外,针对用户群体划分的非参数化先验不仅有效建模了用户偏好的多样性,也为用户解耦表示的学习提供了便捷。在真实数据集有效验证了模型推荐精度与可解释性方面的性能。