结合节点结构与内容相似度的复杂网络社团发现方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:sunwen_fly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前多学科交叉的研究热点中:复杂网络的研究受到了越来越广泛的关注,在计算机科学、物理学、生物学和社会及管理学等领域都产生了重大的意义和深远的影响。社团发现是复杂网络研究中十分重要的研究方向。社团发现对于加强对复杂网络的结构理解、功能分析和行为预测具有重要的理论意义及实用价值,已被广泛应用于恐怖组织识别、推荐预测、搜索引擎开发和网络舆情监控等诸多领域。如何快速、准确的发现复杂网络中的社团(社团发现)仍然是一个关键问题。已有社团发现方法主要是针对网络拓扑结构,且难于处理大规模网络。近年来虽然也有了不仅通过引入文本内容提升社团发现质量,且适用于大规模网络聚类问题的社团发现方法。然而这些方法算法维度较高,故难于精确刻画结点的内容表征,且计算量较大。因此,研发聚类精度高、算法执行效率好、并且适用于大规模复杂网络的社团发现方法成为如今的研究热点。基于此,本文主要的研究对象为复杂网络中的社团发现方法,做了两个方面的工作:1)复杂网络可以抽象为一个具有复杂连接关系和结构的可演化图。针对以往比较直观的图的社团识别分析及划分,我们提出可有效处理结点内容的高斯混合模型(GMM),更好的融合了复杂网络上的节点结构和内容信息的相似度,将复杂网络图进行采样构造成一个简化图,最后图聚类。由于该法可采用不同参数拟合高斯混合模型中的数据点,故具有更好的可扩展性。2)由于图聚类的时间复杂度相对比较高,且高维度的复杂网络数据基本上都可以转换成矩阵的形式进行处理,因此我们又提出了结合节点结构和内容信息相似度的模块化的非负矩阵分解(NMF)模型,以匹配拟合原复杂网络,从而得到最优化的节点的网络精确表示,最后使用K-means聚类算法进行聚类。该方法简明且易于操作,同时具有对社团属性关系的可解释性,故能更准确地表示节点与社团之间的关系。本文我们提出的这两个结合节点结构与内容相似度的社团发现新方法,在真实网络上进行实验验证,维度计算性能和准确度明显优于已有方法,从而进一步提升了社团发现的精度和效率。
其他文献
近来年,我国信息产业高速发展,网络技术的广泛应用使得个人、企业、网络服务提供者都参与网络活动中,个人信息在不受时空限制的网络空间中,被规模化地收集、存储、分析、加工后进行商业利用。我们享受着信息社会和互联网的发展给我们日常生活提供便利的同时,信息控制主体也大量挖掘个人信息中所蕴含的财产价值,给其带来极高的经济收益,网络环境下个人信息侵权问题便不断突显。目前我国并未设立个人信息权,对于个人信息的权利
本论文在分析我国供热体制以及热能计量技术现状的基础上,提出了一种基于供热管道流向压力测量的热能计量方法以及和热量控制机构一体化的设计。论文首先阐述了课题研究的背
在实践方面,随着越来越多的污水处理PPP项目进入建设阶段,绩效管理成为政府高度重视和亟待解决的问题;在理论研究方面,论文运用文献计量方法,分析我国PPP绩效研究特征,并预测今后PPP绩效研究将更加关注基于全生命周期视角的PPP项目绩效管理研究与不同行业PPP项目绩效管理研究两个方面。论文在此背景下进行了污水处理PPP项目中政府方对于项目公司的全生命周期绩效管理研究,将项目全生命周期划分为项目筹划、
对于以六元环为母核的氟硼二吡咯类(BODIPY)化合物,由于其荧光量子产率高、摩尔消光系数大、合成步骤简单、结构易修饰、对环境变化不敏感等优点被广泛研究。但BODIPY类染料还存在缺陷:Stokes位移小、荧光在固体状态下易淬灭等。而对于七元环氟硼荧光染料(BOPYIN)由于共轭程度增加,得到的化合物具有更好的光物理化学性质,如更大的Stokes位移以及非平面构型(马鞍形)等。本文通过简单的方法合
糖尿病是一种多病因的代谢疾病,是由胰岛素绝对或相对不足而引起,以慢性高血糖为特征,常伴有脂肪和蛋白质代谢紊乱。根据美国糖尿病病理学会2009年公布的糖尿病诊断标准,目前
长紫菜(Porphyra dentata)是中国南方自然紫菜资源的主要种类之一,其藻体较薄、口感好。长紫菜的固醇萃取物有抗肿瘤活性,且有研究报道其发酵产品具有多种生物活性,有较高利用价值。紫菜采收有“分茬”的特点,不同采收期的紫菜在品质特性相关指标存在差异,但关于不同采收期长紫菜品质差异机制研究鲜有报道。紫菜具有复杂多样的进化历史和生物学特征,随着后基因时代的到来,在藻类研究中也得到了应用。高通量
针对日光温室昼夜温差大、环境稳定性差,会直接影响作物的产量与品质等问题。山西农业大学设施农业工程研究所设计研制出水贮热温室叶菜生产系统,论文就系统的结构建造、性能及提升性能的措施进行了试验分析。结果如下:(1)水贮热温室的结构与建造:该温室结构长60 m、跨度10.5 m,南北朝向。四周围以0.75 m高彩钢板作池,用水或营养液作贮热介质,无后墙蓄热保温。2018年2月设计建造,6月初步建成,9月
行星齿轮传动系统由于其重量轻、大传动比且能实现功率分流等优点,在民用和军工领域被广泛使用。但是由于在实际的加工和装配过程中不可避免的误差的存在,使得各个行星轮载荷的分担不均等,从而影响整个行星齿轮传动系统的承载能力,而且在工作过程中会伴随着振动和噪声的产生,这会在一定程度上对齿轮的寿命和可靠性造成影响。因此,对行星齿轮传动系统均载性能的研究一直以来都是一个很重要的课题。以往的学者在做此类的研究时,
当前,计算声学在各领域得到广泛的应用,在语音学上声学仿真技术已经非常成熟,特别是静态声道(边界)的声学仿真。然而在研究语音生成过程中,人体声道比较复杂,特别是连续发音
哈尼梯田作为世界景观文化遗产具有艺术价值、历史价值、科学价值、社会或精神价值和提供教育和创造经济功能,有助于保持文化多样性,对其保护具有重要意义。哈尼梯田作为活态的景观遗产,其保护与开发是相互影响的,而当下文化旅游作为文化遗产开发的主要方向,有效地促进遗产地的发展,但其以经济发展为主要导向与遗产地文化、社会、环境的保护存在不可避免的冲突。为实现遗产地的可持续开发与保护,本文以哈尼农耕产品可持续开发