基于分身似然的多片网络社区发现算法

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:guannipishiwori
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络科学已经在计算机科学,统计学,社会科学和生物学等学科中得到了广泛的应用,典型例子包括社交网络,交通网络,电力网络和通信网络等等.近年来,随着网络规模和网络复杂性的增加以及网络科学技术与理论的不断进步,网络科学在实际中的应用也得到了不断的深化和扩展.社区结构是在复杂网络研究过程中最为重要的网络结构特征,是该领域的重要研究方向之一.在对大规模的实际社区结构进行深入分析过程中,网络社区发现起着关键的作用.目前,网络科学的主要任务仍然是集中在单个网络上,而在实际情况中许多网络并不是孤立存在的,而与其他的网络可能存在相互依赖或者合作与竞争的关系.多片网络同时获取了节点间多种类型关系,例如这些节点在不同的时间下组成的动态网络,又如在不同社交软件下组成的多层社交网络.为了综合利用多片网络中片与片之间的结构信息以及全面研究这些节点的共享社区,人们提出了很多种多片社区发现方法来代替单片的社区发现方法.在这些多片社区发现方法中,统计方法因其在描述多片网络的生成模式方面发挥着重要作用,近年来受到越来越多的关注.随机块模型(SBM)作为一种典型的随机图生成模型,在网络社区发现任务中得到了广泛的应用.由于在SBM下社区标签预测的理论优化问题是NP-hard问题,从而无法实现精确似然推断.在SBM基础上,多层随机块模型(MLSBM)是一种广泛应用于描述多层网络中多层社区结构的概率模型.它的主要思想是所有的网络层对节点都持有共享的社区分配,而每一层网络的模型参数可以各自独立设置.在大规模网络环境下,对MLSBM进行精确的似然推断在计算上同样是不可行的.因此,人们开发了许多近似策略来提高计算效率.然而,这些方法中的大多数仍然不能扩展到大规模网络.为此,针对大规模多层网络的社区发现问题,本文在分身似然(Split Likelihood,SL)框架的基础上,将SL算法推广到多片网络中,提出多层分身似然(ML-SL)的快速算法.在这个算法中,我们提出了一个适用于多片网络的推断函数――分身似然函数,通过将原始SBM的变量分割成两组具有独立同分布的随机变量来避免处理原始观测似然的推断问题,用于预测所有网络层的共享社区分配并估计MLSBM中所有网络层的参数,并证明了其参数的收敛性.同时,本文对于ML-SL算法的估计结果给出了相合性的证明,为ML-SL算法的社区发现提供了理论保障.同时,在实际网络中很有可能出现网络社区内部节点的度差异较大的情况,或存在Hub节点使其不满足随机块模型的假设,此时ML-SL无法使用.为了解决此类多片网络的社区发现问题,本文提出改进版的ML-SL算法,称为条件分身似然算法(ML-CSL).最后,本文通过大量的数值实验和两次实际数据分析,验证了该方法在社区标签预测准确度和计算效率上的优越性.
其他文献
生态文明,是人类社会创造的以构建人与自然和谐发展为目标的文明新形态。建设生态文明,既是关乎一国人民的福祉和民族发展未来的重大问题,也是国际社会共同关心的普遍问题。坚持人与自然和谐共生是新时代中国特色社会主义基本方略之一。党的十八大在首次提出法治是治国理政的基本方式的同时,将大力推进生态文明建设与经济、政治、文化、社会并列作为中国特色社会主义“五位一体”的总布局,充分反映了中国共产党对生态文明建设认
随着少数族裔文学的兴起,与亚裔美国文学有关的研究在国内也方兴未艾。近年来,印裔美国文学通过印度裔美国作家的努力获得了越来越多的关注,其中裘帕·拉希莉被誉为美国最知
能源问题在全球学术界一直是热门话题,然而关于该领域论文的体裁分析却存在严重不足,尤其是关于论文的结果与讨论部分的体裁分析更是少之又少。据此,本文试图从体裁分析的角
在信息化的今天,每时每刻都会产生大量的数据,云存储由于其存储量大、便利、低服务费等特征逐渐成为主流。个人用户以及企业纷纷把数据存储到云服务器。但是云服务器是半可信
PPP(Public-Private Partnership),又称PPP模式,即政府和社会资本合作,是公共基础设施中的一种项目运作模式。在该模式下,鼓励私营企业、民营资本与政府进行合作,参与公共基础设施的建设。2016年,政府在全国各地区大力开展PPP模式建设运营项目,针对不同地区、不同资本组成方式、不同政策及不同运营方式等出现了各式各样的PPP建设项目,带动了全国市场经济发展,激活了各行各业尤
相关性分析是研究两组数据之间关系的重要内容,在生物医学、气象学、工程学等各领域都有重要应用.在分析和挖掘实际数据时,需要通过发现变量之间相关性从而进行预测、因果分析等更深层次的探索.本文在函数型数据背景下,主要探究函数型变量相关性度量及检验问题.对于传统截面数据,Kendall提出根据随机变量之间协同一致的程度度量两个变量之间相关性的Kendall τ相关系数.对于函数型数据,本文通过函数在闭区间
近年来,我国新型城镇化进程不断加快,轨道交通在城市区域公共交通出行的骨干作用日渐突出,国内较大的城市已逐步形成城市轨道交通、市域铁路、城际铁路等不同制式构建的多层次、多主体轨道交通网络。在路网达到一定规模、多种轨道交通方式并存的发展态势下,改善各种轨道制式独立运营的现状,打造一张网络结构和网络功能可靠的区域多制式轨道交通复合网络是未来城市发展的必然需求。本文结合多制式轨道交通网络不同制式的技术特征
针对具有非线性、高采样频率、强耦合等特性的机电系统的控制问题,模型预测控制(Model Predictive Control,MPC)作为一种处理多约束系统最优化控制问题最有效方法之一,渐渐成
随着我国社会经济的快速发展,相应的环境问题也越来越突出。节能减排成为我国一项长期坚持的政策。建筑行业作为我国耗能量最大的产业,其节能减排的效果直接决定了我国环境治理的成果。新型墙板具有功能多样化、绿色环保、质轻高强、工业化程度高等优点,在市场上快速发展,因此不断开发和推广新型绿色墙体材料是我国建筑行业进行节能减排的主要措施,为我国环境治理的工作提供强有力的保障。本文研究的硅酸钙水泥发泡复合墙板作为
目的:骨关节炎(osteoarthritis,OA)是以关节软骨退行性变为主要特征的疾病。软骨细胞凋亡增加导致关节软骨退变加速,在OA疾病进展中发挥至关重要的作用。卵泡抑素样蛋白1(FSTL1)为一种促炎性蛋白,在OA患者血清及关节液中表达高于正常,其对于软骨的凋亡影响及分子机制尚无相关报道。本研究旨在确定FSTL1对硝普钠(SNP)诱导的软骨细胞凋亡的影响,并探讨其潜在分子机制。方法:分离培养正