大规模异构信息网络社区发现算法与社区特征研究

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户：cau_hechun1

【摘要】

：

随着互联网的飞速发展,信息呈现出爆炸式的增长,出现了各种各样的信息网络,如:学术网络、社交性网络(e.g.Facebook)等。在对信息网络的研究中,社区发现问题受到了研究者的广

【作者】

：

张正林

【出处】

：

北京邮电大学

【发表日期】

：

2017年01期

【关键词】

：

异构信息网络大规模重叠社区发现社区特征

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的飞速发展,信息呈现出爆炸式的增长,出现了各种各样的信息网络,如:学术网络、社交性网络(e.g.Facebook)等。在对信息网络的研究中,社区发现问题受到了研究者的广泛关注。一些研究者通过构建同构信息网络来发现社区结构,如构建作者合著网络来发现作者合著社区。但同构信息网络只包含单一实体和单一实体间关系,无法很好地反映网络的拓扑信息与网络实体的语义信息,会导致发现的社区结果准确率不高。异构信息网络包含多种实体和实体关系,其主要问题是面临大规模和异构性导致的社区发现的复杂性挑战。针对该问题,一些研究者通过构建多路网络进行社区发现,这种方法可以解决网络大规模和异构性带来的社区发现复杂性挑战,但只能发现单一种类节点的社区结构。另有一些研究者提出基于概率模型、矩阵分解的社区发现算法,虽能很好地契合网络异构性的要求,但由于空间、时间复杂度较高,无法满足网络大规模的要求。另一方面,重叠社区是真实网络的一个显著特征,即网络中的一个节点可能属于多个社区,这就要求社区发现算法能够有效发现网络中的重叠社区结构。在发现异构信息网络的社区结构后,如何描述社区的特征,从而更好地展示和分析社区也是一个重要问题。因此,对大规模异构信息网络重叠社区发现算法与社区特征进行研究是有必要的。为了准确、高效地发现大规模异构信息网络的重叠社区,本文首先提出了一种基于邻居节点影响力传播标签的重叠社区发现算法,该算法具有线性时间复杂度,适用于大规模同构信息网络。在此基础上,针对异构信息网络的大规模性和异构性特点,本文将上述同构信息网络社区发现算法引入到异构信息网络中,结合网络拓扑信息与语义信息,提出了基于多路网络抽取和种子社区的异构网络重叠社区发现算法。该算法适用于任意形态的异构信息网络,并能针对用户不同的研究需求,选定不同的中心节点类型,从而得到不同的社区划分结果。最后,本文针对异构学术网络,通过引入社区论文关键词分布、论文时间分布、作者领域词分布、社区间引用强度等描述方法,展示和分析了异构学术网络的社区特征。在实验验证部分,本文首先基于真实网络和LFR基准网络,使用重叠模块度、归一化互信息(Normalized Mutual Information, NMI)和F-score三个指标,对提出的基于邻居节点影响力传播标签的重叠社区发现算法进行了性能评估。实验结果表明,算法具有较高的准确性和稳定性,且具有线性时间复杂度,能够适用于大规模同构信息网络。之后,基于构建的真实异构学术网络,通过社区内论文关键词相关性、论文主题相似性、作者相关性等指标对基于多路网络和种子社区的重叠社区发现算法进行了性能评估。实验结果表明,本文提出的基于多路网络抽取与种子社区的社区发现算法有效提高了大规模异构信息网络社区发现的准确度,且具有线性时间复杂度,时间开销较低。同时,本文引入的社区特征描述方法有效标识与展现了异构学术网络的社区特征。

其他文献

分层教学法在高职数学教学中的应用

数学教学在高职教学中非常重要。目前,许多新兴行业例如电子科技等都是需要以数学为基础来进行的。并且,随着新课标改革的不断推进,高职数学教学也应该随之不断变革深化。因

期刊

分层教学法高职数学教学应用

顶板煤柱动态性观测方法与分析

针对中兴煤矿坚硬顶板条件,运用实测分析法对区段煤柱稳定性进行了详细分析研究.实测内容包括:超前支承压力分布规律、侧向支承压力分布规律、煤柱上方顶板离层变化规律、煤

期刊

中兴煤矿坚硬顶板煤柱稳定性留设宽度实测分析法支承压力巷道断面松动圈顶板离层矿压

鸡传染性法氏囊病病原学诊断研究进展

鸡传染性法氏囊病病原学诊断研究进展王川庆蔡宝祥陈溥言（南京农业大学，江苏４５０００２鸡传染性法氏囊病（ＩＢＤ）于１９５７年首次发生于美国，１９７９年传入我国，１９８９～１９９２年期间曾对我国养鸡业造成毁灭性打击〔１～４〕。此后，随着

期刊

病原学诊断南京农业大学抗原检测禽病学中国畜牧兽医学会核酸探针技术学术研讨会变异株鸡传染性法氏囊病

基于STM32的智能饮水机控制系统

针对传统饮水机功能过于单一且不够人性化的弊端,本文设计了一款基于STM32的智能饮水机控制系统。以STM32为控制核心,利用无线控制原理,将饮水机的工作状态和水质状况发送至

期刊

智能家居STM32饮水机远程控制

兰属杂交兰绿翡翠组培变异的RAPD检测与鉴定

从兰属杂交兰绿翡翠组培群体中筛选得到表型突变体8株,与正常植株相比多分蘖且矮化,部分植株叶卷曲利用50条随机引物对突变体和正常株进行RAPD检测,结果显示,RAPD检测对突变

期刊

杂交兰组培变异分蘖Cymbidium hybrids RAPD somaclonal variation tiller

散体顶板锚拉支架系统的离散元数值模拟

本文采用最新的离散元UDEC3.0版本对锚拉支架支护散体顶板进行了数值模拟分析计算,研究了散体顶板的应力场 ,锚拉支架的锚杆的轴力和拉杆的拉力,顶板位移,拉杆的变形迹线,锚

期刊

散体顶板锚拉支架离散元数值模拟应力场锚杆轴力

我国将调整完善国家扶贫战略

国家发展改革委地区经济司司长范恒山日前表示，我国将调整完善国家扶贫战略和政策体系，研究制定区域规划和政策文件，着力解决集中连片和特殊类型贫困地区发展问题。

期刊

国家发展改革委扶贫战略调整贫困地区发展地区经济政策体系政策文件区域规划

126例前庭性偏头痛患者眩晕发作时间特征分析

<正>前庭性偏头痛（vestibular migraine, VM）为一种常见的眩晕性疾病。2013年,在第三版国际头痛疾病分类测试版（ICHD-Ⅲ-beta）附录发表了该病的诊断标准[1]。VM的发病机制尚不明

期刊

前庭性偏头痛发作时间后循环梗死特征分析

高职汽车营销类课程思政教学设计与实践

思想政治教育是我国高等教育中的重要组成部分。在教学中坚持贯彻把思想政治工作贯穿教育教学全过程——全程育人、全方位育人。本文以“汽车商务礼仪”为例介绍了课程思政教

期刊

课程思政商务礼仪教学设计实践

FLAC^2D3．3锚杆单元模型的修正及其应用

现场和实验室测试表明,锚杆与围岩相互作用全过程呈现:初撑、增阻、恒阻、降阻直至失效,锚杆阻力下降和失效是大变形巷道锚杆支护所具有的基本规律.为此,本文对FLAC3.3中锚杆

期刊

锚杆单元模型力学特性数值模拟围岩控制

大规模异构信息网络社区发现算法与社区特征研究

与本文相关的学术论文