论文部分内容阅读
随着以因特网为代表的各种信息技术的迅猛发展,人类大步迈入了网络时代。今天,人们生活在一个充满着各种复杂网络的世界中,以复杂网络为研究对象的网络科学也得到了快速的发展。作为网络科学的热门研究方向之一,链接预测能够通过网络的拓扑结构和节点属性等信息预测网络中尚未产生连边的两个节点之间产生链接的可能性。这里既包含对丢失链接的预测,也包含对未来可能产生的链接的预测。链接预测的研究不仅具有广泛的实际应用价值,而且具有重要的理论研究意义。目前,研究人员已经从不同的角度提出了大量的链接预测方法。其中,基于网络拓扑结构的相似性方法受到了较高的关注。局部朴素贝叶斯(Local Na?ve Bayes,LNB)模型是基于网络拓扑结构相似性方法中较为高效的一种,具有较高的预测精度和相对较低的计算复杂度。本文提出了改进的LNB模型。LNB模型认为不同的公共邻居具有不一样的作用,通过引入功能函数对不同公共邻居的贡献度进行区分,从而能很好地提高预测的精度。然而LNB模型忽略了其它结构信息的影响。受到CAR方法的启发,本文在原LNB模型的基础上考虑局部社团结构信息的影响,对LNB模型进行了修改。在改进的LNB模型中引入一个新的功能函数,增加了局部社团链接对预测结果的贡献。接着本文考虑了候选节点对的度分布对预测结果的影响,即根据度分布将网络中原有的连边进行分类,某种类型的连边越多,网络越倾向于产生此种类型的连边。根据候选节点对的度可以将其划分到前文得到的边的类型中,并将此种类型的边的占比作为其可能产生连边的概率。为了验证提出模型的预测准确率,我们在12个真实网络上进行了实验。实验表明,我们的模型在大多数情况下具有最佳的预测性能,并且相对于原LNB模型,预测精度有显著的提高。在无权网络工作的基础上,我们将提出的模型在加权网络上进行拓展。首先对LNB模型中的功能函数做进一步的改进,考虑候选节点与公共邻居之间连边权值的影响。接着将原LNB模型中的聚集系数替换为更适用于加权网络的加权聚集系数。最后我们将无权网络中考虑到的顶点的度替换为顶点的强度。由于在加权网络中点的强度不一定为整数,根据强度对网络中的连边进行分类会使得边的类型非常多,而每个类中边的数量很少。因此,我们首先对点的强度进行等宽区间划分,然后根据候选节点对的强度所属的区间对候选节点对进行分类。实验结果表明,本文提出的模型在加权网络上具有良好的预测性能,并且实验结果也验证了连边权值对加权网络中的预测性能的提升。