基于节点相似度的Web网络生长模型及其分析

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:guokm01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展,国际互联网(Web)已经成为人们信息共享与信息传播的主要媒介。对Web网络结构特征和演化规律的探讨成为Web网络研究的重点,建模则成为主要的研究方式。本文从Web网络演化过程中的节点相似度属性入手,选择对Web网络物理拓扑结构和内容相关结构产生深远影响的节点相似度属性——内容相似度和邻居相关度属性,提出了基于这些属性的网络模型,对Web网络演化过程作了深入的探讨。 当前的Web网络建模主要集中在物理拓扑层面上,但是现有模型并不能很好的反映网络聚团结构的形成以及Web网络作为有向网络的特殊性。本文首先提出了Web网络的邻居相关度概念,作为节点拓扑相似度的度量标准,并在此基础上提出基于邻居相关度的有向模型DNR。模型从入度和出度两个角度对Web网络物理拓扑结构作了深入分析,阐明了邻居相关度属性对网络结构特别是聚团结构的影响。 其次,针对页面内容信息对Web网络连边形成有着直接作用,引入内容相似度属性来度量节点内容结构的相似程度,并提出了一种基于内容相似度的Web网络演化模型(DCS模型)。理论分析以及大规模的实验验证表明,该模型既能解释网络节点连接度的幂律分布,又正确的反映了节点连边内容相似度分布,揭示了网页节点倾向于连接与它内容相似的节点。 进一步的,我们改进了此模型,使新的模型能够更准确地反映Web网络的结构特征,特别是Rich-Club现象,全面分析了内容相似度属性对网络整体结构的影响。
其他文献
近年来,通过并行处理的设计思想,利用现有的设备集群工作来解决入侵检测系统能力不足的方法成为了一种热门技术。本文正是基于这种思想,利用现有的主机构成分析器节点,运用软件设
随着World Wide Web(简称WWW,Web)的迅速发展,Web上的信息与日俱增,互联网已成为人们获取信息的重要来源。但是,由于因特网的广泛性和开放性,在因特网上发布信息极为容易而且
随着信息技术的发展,数据挖掘技术得到了广泛的关注,这促使业界人士对该项技术进行更为深入的研究。在数据挖掘技术中有很多研究领域,关联规则数据挖掘就是其中一个重要的研
无线传感器网络是由大量的传感器节点以自组织的方式形成的多跳网络,路由协议是无线传感器网络中最基本、最重要的部分之一。现有的路由协议主要针对静态网络,无法应用到具有移
微震作为监测预警矿井重大动力灾害的一种区域性监测手段,具有谱成分丰富、频带较宽的特性。在冲击地压灾害发生前有很多微震前兆信息,这些信息蕴含在灾害发生前相当长一段时期
随着图结构在复杂数据建模方面的广泛应用,图数据库技术得到了快速发展。如何从图数据库中快速检索数据已经成为一个研究热点。在图查询中,子图匹配查询和相似性查询是两种重
近年来,P2P网络受到广泛的关注并发展迅速,而资源搜索是P2P网络的关键技术之一,如何高效地搜索网络资源是P2P网络的研究重点。本文主要从资源特征分类、资源密度、资源热度等方
无线传感器网络集传感、数据处理和无线通信于一身,通常被部署在各种恶劣环境中进行信息获取和收集任务。在军事国防、环境监控、工业管理等各方面都具有十分广阔的应用前景。
随着计算机软硬水平的不断提高,嵌入式领域的发展也取得了长足的进步。目前,嵌入式与Linux技术的结合正在推动着嵌入式技术的飞速发展,嵌入式系统的研究和应用产生了显著的变
随着电子政务应用的不断深入,使得政府部门的工作方式发生了巨大的变化。电子政务给政府工作带来方便和高效率的同时,也带来许多安全问题。如何保障在信息安全的前提下提高政