论文部分内容阅读
人工智能技术的迅猛发展,使得人类社会与信息世界的界限越发模糊,日趋呈现出人机共生、万物互联的新格局。在此背景下,数据的种类与数量与日俱增,如何从浩如烟海的大数据中快速、准确地甄选有价值信息已然成为当下学术界与工业界所共同面临的主要难题之一。推荐系统,作为传统信息检索的有效补充手段,充分利用用户与物品自身内容特征及其二者间的交互数据自动过滤无用信息,旨在对抗信息过载问题,以期达到信息生产者与消费者之间的博弈均衡。协同过滤,特别是矩阵分解,是推荐系统背后的核心技术之一,其巧妙地利用群智感知思路实现个性化推荐,由于其稳定的预测性能以及灵活的扩展能力,一直以来都是学术界与工业界的研究热点。但其性能时常受限于数据稀疏与冷启动问题。目前比较主流的解决思路是利用用户间的社交网络信息弥补用户-物品交互数据。然而,由于社交网络数据的复杂性,现有结合社交信息的推荐算法多为启发式方案,未能充分挖掘社交网络中的有用信息以辅助推荐任务。幸运的是,图嵌入技术的兴起为社交推荐的研究提供了新思路,其致力于将高维稀疏的社交信息嵌入到低维稠密的向量空间,同时最大化的保证原有网络的结构信息。鉴于此,本文以社会化推荐系统为研究对象,重点探索矩阵分解与图嵌入技术的有效融合方案,提出了依次学习和联合学习两种融合范式,现将主要工作罗列如下:首先,针对协同过滤固有的数据稀疏问题,提出矩阵分解与神经图嵌入技术依次学习的算法框架SoTriCF。其中集成了三种经典的协同过滤技术,以此来捕捉用户与项目间的多重相似性;然后利用图嵌入技术处理社交信息得到的用户低维表示依次地整合到推荐场景中,以至达到缓解评分数据与社交数据的二重稀疏性;其次,还提出了基于隐变量映射机制的解决方案来缓解冷启动问题。另外,为了进一步达到推荐任务与社交网络分析任务的有效融合,提出矩阵分解与神经图嵌入模型联合学习的集成方法NGE-MF,以此实现评分预测与用户网络嵌入两种任务间的双向互动与协同优化。矩阵分解可以学得用户对项目的行为习惯,神经图嵌入可以充分挖掘用户的社会特性,通过将两者进行联合学习,使得用户隐特征能够进行统一优化,从而得到更符合实际应用需求的隐特征表示。最后,通过在三个真实数据集上进行大量的对比实验与参数分析,结果表明两种结合范式的社交集成方案均取得了更优的推荐性能,有效的缓解了数据稀疏和冷启动问题,充分说明了所提出算法的合理性与有效性。