面向网络数据的改进标签传播算法设计与实现

来源 :山西大学 | 被引量 : 0次 | 上传用户:xqiqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中,许多大型复杂系统都是以网络的形式存在的。随着信息量的增加,网络的规模也越来越大,比如微博社交网络、交通网络、大型电力网络、生物神经网络等等。因此,挖掘网络的内在结构,对于更好的分析和运用网络具有至关重要的意义。社区发现正是挖掘复杂网络的研究热点之一,它是探索和理解网络如何工作的一个重要方法。目前,已经有许多社区发现方法被提出,其中标签传播算法(LPA)是处理大规模网络的一种重要算法,由于其拥有线性时间复杂度而受到广泛关注。但由于该算法中每个节点的标签更新依赖于其邻居节点的标签,标签的更新顺序对算法的迭代速度和聚类效果非常敏感,所以直接影响了社区划分结果的准确性和稳定性。基于以上的问题,本文提出了两种基于标签传播算法的改进算法,具体研究内容如下。(1)提出基于加权聚类集成的标签传播算法。该算法利用聚类集成技术,对多次标签传播算法产生的结果集进行融合,并通过模块度对单个基聚类的有效性进行评估,以此来构建加权相似性矩阵,最后采用层次聚类方法形成更理想的社区划分结果。通过将提出的新算法与其他改进的标签传播算法在真实数据集上进行的实验比较,结果显示,在NMI指标和ARI指标上的结果都能展示出新算法能有效的提高社区发现的鲁棒性。(2)提出基于节点重要性的标签传播算法。该算法通过将信息熵和模块度结合的方式来评估一个节点的重要性,并将节点按照节点重要性从高到低排序,然后使标签从关键节点开始传播,并且选择其最重要的邻居节点的标签来更新自身的标签,从而提高了社区发现的准确性。最后,将新算法和近几年几个改进的标签传播算法在一些典型的社区网络上进行了对比实验分析,实验结果展示出基于节点重要性的标签传播算法能有效地提高社区发现的质量。本文从不同的角度对标签传播算法进行了改进,且改进后的算法能有效地提高社区发现的质量。新算法的提出为网络数据的分析提供了新的技术支持,也为更准确地挖掘网络社区提供了更为广泛的应用价值。
其他文献
针对尾矿坝体在自然状态下会受到化学溶液、外部载荷和渗流作用影响这一实际情况,分析了尾矿砂化学-应力-渗流耦合作用机理,采用有限差分方法,深入研究了在化学、应力、渗流作用
考试是考试主体根据一定的施考目的,通过一定的考试中介对应考者的某方面或某几方面的素质水平进行测度、甄别和评估的社会活动。自从人类有意识、有目的的考试活动产生以来,
随着房地产行业整合加速,企业在加快区域化发展、全国化布局的同时,已经从粗放开发模式进入精细化开发模式,由原来单项的本地化的管理向区域化、集团化发展。如何在企业管理
当前,国家大力推动实施"一带一路"、京津冀协同发展、长江经济带三大战略。三大战略体现了新常态下国家区域协调发展的新思路,区域协调要以主体功能区划为基础,以居民收入同
近年来,我国公共图书馆事业蓬勃发展,国家图书馆研究院《2015全国公共图书馆事业发展基础数据概览》中显示我国公共图书馆数量共计3139个,持证读者数量、人均购书费、藏书量
采茶舞作为源自赣南客家茶文化的代表形式,是集民间舞蹈、灯彩等多样元素为一身的民俗体育项目。采茶舞具有生动有型、技高有决、富有张力与艺术色彩的特点。采茶舞在其从诞
[目的]探讨口腔癌根治同期组织瓣修复病人术后口腔护理方法。[方法]将80例口腔癌根治同期组织瓣修复病人随机分为两组各40例,对照组给予常规口腔护理,研究组给予改良口腔护理
目的了解城市孕妇自然分娩行为意向,分析影响孕妇自然分娩行为意向的因素,为促进自然分娩提供健康教育依据。方法对658名孕妇进行自然分娩行为意向调查,并分析其影响因素。结
在进行小学语文阅读教学过程中,教师应该深刻把握住课内阅读与课外阅读的关系,让它们能够有机的结合,这样才能够真正的提高学生整体阅读水平。语文教师需要站在阅读教学实践