基于边划分的重叠社区发现算法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:wangxinyu999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络中的边呈现不均匀分布,某些顶点构成的群组内部边较稠密,而群组之间的边较稀疏,网络的这一特性即社区结构。大量真实网络中包含互相重叠的社区,相比传统的社区,重叠社区更能揭示隐藏的规律。近年来,重叠社区发现已经成为主要挑战之一。重叠社区发现算法中一个新奇而有效的做法是划分边而不是顶点,这一方法即边划分方法。尽管边划分方法在重叠社区发现上有天然的优势,也受到了广泛关注,但该方法仍存在诸多不足。边划分方法中有边相连的两个顶点只能属于同一个社区,这导致发现的社区高度重叠。为了克服这一缺陷,本文提出了基于非对称加权图的边划分方法(Link Partition on Asymmetric Weighted Graph,LPAWG)。LPAWG首先把网络的每条边切分成两条非对称加权边。其次在将边社区翻译成顶点社区时,利用非对称加权边对顶点的偏向只保留偏向的顶点而忽略另一顶点。这一策略使有边相连的两个顶点可以属于不同社区,所以LPAWG可以发现合理程度的重叠社区。针对边划分方法中线图矩阵规模较大的问题,提出根据非重叠社区结构推断出某些边的社区归属从而削减加权线图规模的策略。将这一策略推广到LPAWG上提出加速的LPAWG(Accelerated LPAWG,ALPAWG)。在计算机生成数据集和真实网络上的实验结果表明,LPAWG的正确性明显优于边划分方法,同时ALPAWG在不降低正确性的前提下可以显著削减加权线图的规模。针对边划分方法中加权线图规模大难以求解的问题,提出基于对称非负矩阵分解的边划分方法(Symmetric Non-negative Matrix Factorization based Link Partition,SNMF-Link)。SNMF-Link基于的假设是数据可以通过边-顶点关联矩阵张成的子空间表达。这一假设可以显著减少未知矩阵的规模。提出用乘法更新法则(Multiplicative Update Rule,MUR)求解SNMF-Link,但MUR的优化方法收敛较慢。为了克服这一缺陷,进一步提出将增广拉格朗日方法(Augmented Lagrangian Method,ALM)应用在SNMF-Link上,并用最优梯度法求解。算法的复杂性分析表明SNMF-Link和ALM是有效性的。在测试数据集上的实验结果表明SNMF-Link在不降低正确性的前提下用时更少,ALM优化的SNMF-Link比MUR优化的SNMF-Link和典型的谱聚类方法Ncut(Normalized cut)用时都少。
其他文献
烟草翻译起始因子家族成员eIF4E-6(Ntab0942120)与马铃薯Y病毒VPg互作决定着PVY对烟草的侵染进程,为打断PVY对烟草细胞的侵染途径,增强烟株自身对PVY的抗性,本研究应用TALENs
在大规模密集的WLAN部署环境下,用户在统一管控下的不同接入点(AP)之间的切换越来越频繁,然而传统切换机制会带来较长的时延,因此,如何保障在切换时的用户体验是一个严峻的挑
为了明确准噶尔盆地玛南斜坡风城组优质储层的地震响应特征,对云质岩、火山岩等优质储层进行准确识别。本文在前人研究成果的基础上,首先对目的层段进行精细构造解释;其次,利
吉林省桦甸市鹿角沟金矿床位于桦甸市红石砬子镇高兴屯东。近几年来通过大量的地质、物探和化探工作,已在研究区内发现了小型金矿床多处,具有良好的找矿前景。研究区位于华北
在多媒体、图像处理、模式识别等可容错的应用中,即使计算过程不完全精确也能产生有用的结果,此时容错应用中的精确计算电路就会造成系统硬件资源的浪费。非精确计算的思想是
尖状栅藻(Scenedesmus acuminatus)是一株生长快,油脂累积量高,具有可开发生产生物柴油的单细胞绿藻。本论文以产油尖状栅藻为实验材料,以改良BG-11(1.0S)为对照,设置0.25S、0.5S
伴随勘探开发程度的提高和技术的进步,复杂断块油藏也逐渐成为勘探开发的对象。储层作为油气勘探开发的直接目的层,准确地预测储层的性质和变化规律对于提高钻井成功率、降低
本文设计并合成出三个N-苯基咔唑-均苯三甲酰胺衍生物,并研究了它们的超分子自组装及空穴传输性能。以对乙酰氨基苯酚和卤代烷为起始原料,经过优化设计的反应路线成功合成出具有不同烷氧基链的N-苯基咔唑-均苯三甲酰胺目标分子7-C1、7-C6和7-C12。通过1H NMR、13C NMR和质谱,对目标分子以及重要中间产物的结构进行鉴定。通过紫外-可见吸收光谱、荧光发射光谱、浓度梯度核磁共振氢谱及偏光显微镜
随着基因测序技术的进步,基因组序列的信息量呈现爆炸增长的趋势。人们迫切需要对这些信息进行分析处理的工具,而要对基因序列进行分析首先需要识别出DNA编码区也就是最终表
东升超贫磁铁矿是近年来在木兰县新发现的磁铁矿,截止2014年4月30日,木兰县东升超贫磁铁矿累计查明(331+332+333)铁矿石资源储量3578.71万吨,mFe平均品位8.81%。其中探明的内蕴