论文部分内容阅读
随着互联网技术的快速发展,网络中的数据正在以我们无法想象地速度产生,信息过载现象日益严重,为了信息被更加高效地发掘和利用,个性化推荐技术被提出,并且得到了广泛研究和发展。近年来,异质信息网络(Heterogeneous Information Network,HIN)的研究也引起了广大学者的关注,许多数据挖掘任务也逐渐使用HIN进行探索,也为推荐系统提供了一个新的解决思路。在推荐系统中,常常包含了各种类型的对象(如电影推荐中的用户、电影、导演、演员等)以及对象类型之间的丰富关系,异质信息网络恰恰能够将这些信息表达出来。HIN能够收集这些全面、丰富、有价值的语义信息,使之产生更好的推荐效果。基于异质信息网络的推荐技术,能够在一定程度上解决传统推荐系统中面临的数据稀疏性、可扩展性等关键问题。过去对于异质信息网络的研究,虽然能够将不同类型的对象考虑在一起,但是对象之间连接的权重往往会被忽略,这种权重信息能够反映对象之间关联的紧密程度(如用户对电影的评分,通常用1-5的数值表示,值越高,用户就越喜欢,其关联程度也应该更紧密),使得对象间的语义有更好的可解释性,所以本文在构建异质信息网络的同时,会将权重信息也表现出来,提出加权元路径的随机游走。另外,推荐系统中除了对象的类型不同外,对象还可能包含丰富的属性信息,这些属性信息在推荐过程中也起着重要的作用,若能利用好这些属性信息,推荐的效果也能得到一定地提升,所以本文提出了一种带属性的异质信息网络表示学习方法AttrHIN2vec。该方法将异质信息网络中结点的拓扑结构关系与结点的属性信息结合,通过异质的Skip-gram模型得到更加丰富的特征数据,最后将这些特征数据利用BP神经网络训练出一个协同过滤推荐模型。本文的实验数据集选用MovieLens-1M,实验分为两个步骤:第一步,将推荐系统中的对象构建一个加权带属性的异质信息网络,利用文中提出的AttrHIN2vec方法提取对象的潜在特征;第二步,将潜在特征用于BP神经网络中建立评分预测模型。通过实验对比分析,验证了AttrHIN2vec方法能够改善推荐的结果。