论文部分内容阅读
上个世纪兴起并发展的社会网络研究加深了人们对极其复杂的社会系统的理解。近年来,随着信息技术的发展以及Web 2.0技术的广泛应用,在互联网上涌现出了很多在线的社会网络。这些网络的规模异常庞大且时刻处于动态变化之中,因而需要将传统的社会网络分析和现代的复杂网络研究结合起来才有可能理解人与人之间相互作用的模式和动力学过程。在线社会网络的结构及运行其上的动力学过程,近年来已引起了不同学科研究人员的关注。研究Web社区中个体之间的关系及人的在线行为是近年来信息科学领域非常关心的问题。互联网上人与人之间的关系和相互作用可以用在线社会网络来描述,本文重点研究了在线社会网络的结构、演化及运行其上的舆论动力学过程,此外,本文也提出了刻画复杂网络结构的一个新的拓扑参数——异质系数,亦研究了在线社会系统中个体的活动性和流行度的统计特征及其支配因素。论文主要内容和研究成果如下:1.提出了一个新的网络拓扑参数——异质系数H (0≤H< 1)。该参数可以定量刻画任意网络的度异质性,包括规则网络、随机图、小世界网络、指数网络和幂律网络等。一个完全均质网络的异质系数为0,而一个完全异质网络的异质系数则趋近于1。论文解析地研究了指数网络的异质性,发现其H值上界为0.5。解析地研究了幂律网络的异质性,发现对于无限幂律网络,当且仅当度指数γ∈(1, 2.5)时, H > 0.5;当且仅当γ∈(1, 2]时, H→1。对于γ> 2.5的幂律网络,总是存在一指数网络使得二者具有相同的异质系数。2.研究了一个大型的在线社会网络Wealink的结构。研究发现该网络具有小世界特性、高聚类系数、层次化结构和社团性等与一般的现实社会网络相似的共性,同时也表现出了自己的特性:度分布具有无标度特性,连通子图规模分布、度分布和社团规模分布呈现出锯齿状以及度异配性。网络的功能对结构有显著的影响,通过模型阐明了该网络的度分布形成的机制,并探讨了在线社会网络度异配性的起源。3.研究了Wealink的网络结构演化特性。研究发现其规模增长表现出非平凡的S型,进而为Web社区中的Bass扩散模型提供了第一个例证,该特性可以在一定程度上预测在线社会网络的生命周期。与传统的网络增长模型所预测的不同,真实网络的密度、聚类系数、异质系数和模块度随着时间的增长表现出非单调特性,且平均路径长度和直径出现收缩现象。特别地,首次揭示了在线社会网络从同配网络到异配网络的转变,并构建了一网络模型以阐明该跃变过程。4.研究了Wealink中的用户行为。研究发现发出的连接请求被快速地响应,互惠时间分布为指数分布。此外,邀请者/接收者的度值几乎与互惠时间无关。用户行为之间的时间间隔分布,即用户发出邀请之间、接受邀请之间或任意两个事件之间的时间间隔分布满足指数相同的幂律。研究了优先连接现象,发现对于优先接受、优先创建和优先依附三种情况,线性优先性均成立,进而可以有效地预测用户建立连接的行为。5.研究了在线社会系统中个体的活动性和流行度。实证研究发现个体流行度或活动性的分布服从幂律或延拓指数分布,且活动性对人类动力学有显著影响,活跃度越高,用户行为的时间间隔分布越集中,从而从实证角度否定了Barabási等关于人类动力学中普适类的论断。构建了一概率模型阐述不同的活动性和流行度分布产生的机制,发现当优先性指数β= 1即线性优先时为幂律分布,当0 <β< 1即亚线性优先时为延拓指数分布,而当β= 0即不存在优先性时则退化为指数分布。6.研究了社会网络中基于社会影响的离散状态舆论动力学。初始时每个个体的状态可取离散值i = 1,2,…,I,研究发现对于任意的I≥2和自信参数,即个体维持当前状态的概率0≤u< 1,当u与个体度值无关时,状态为i的个体的加权比例<q_i>为鞅,即状态为i的个体的总度值占网络总度值的比例<q_i>的均值为一常数,状态为i的个体的比例q_i随着时间的增长将逐渐收敛至<q_i> ,且随着网络度同配系数的增加,收敛趋势逐渐减慢。当u与个体度值相关时, <q_i>不再是鞅,但<q_i>仍收敛至<q_i>。上述两种情况中,对于有限网络,所有个体的状态将最终达到一致。进一步研究了网络中存在状态不随时间变化的坚定型个体的情况,研究发现当u与个体度值无关时, <q_i>和q_i均收敛至仅与初始时坚定型个体的分布有关的固定比例,最终的场景将是坚定型个体所处于的几种状态共存的平衡态。Barabási-Albert无标度网络上的数值模拟验证了解析结果。该模型强调了度值大的个体对最终的一致态或共存态的影响,体现了社会网络中舆论扩散的一些现实特征。