论文部分内容阅读
随着Internet的发展,国际互联网(Web)已经成为人们信息共享与信息传播的主要媒介。对Web网络结构特征和演化规律的探讨成为Web网络研究的重点,建模则成为主要的研究方式。本文从Web网络演化过程中的节点相似度属性入手,选择对Web网络物理拓扑结构和内容相关结构产生深远影响的节点相似度属性——内容相似度和邻居相关度属性,提出了基于这些属性的网络模型,对Web网络演化过程作了深入的探讨。
当前的Web网络建模主要集中在物理拓扑层面上,但是现有模型并不能很好的反映网络聚团结构的形成以及Web网络作为有向网络的特殊性。本文首先提出了Web网络的邻居相关度概念,作为节点拓扑相似度的度量标准,并在此基础上提出基于邻居相关度的有向模型DNR。模型从入度和出度两个角度对Web网络物理拓扑结构作了深入分析,阐明了邻居相关度属性对网络结构特别是聚团结构的影响。
其次,针对页面内容信息对Web网络连边形成有着直接作用,引入内容相似度属性来度量节点内容结构的相似程度,并提出了一种基于内容相似度的Web网络演化模型(DCS模型)。理论分析以及大规模的实验验证表明,该模型既能解释网络节点连接度的幂律分布,又正确的反映了节点连边内容相似度分布,揭示了网页节点倾向于连接与它内容相似的节点。
进一步的,我们改进了此模型,使新的模型能够更准确地反映Web网络的结构特征,特别是Rich-Club现象,全面分析了内容相似度属性对网络整体结构的影响。