面向网络结构发现的批量主动学习算法

来源 :河北地质大学 | 被引量 : 0次 | 上传用户:X395381435
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的迅速发展,大量在线社交网络平台随之产生,如Friendster、Myspace、Bebo、Facebook、微博以及贴吧等等,发现这些网络的聚类结构及交互规律已成为当前的研究热点之一。研究者提出大量无监督的网络聚类结构发现方法,但其聚类准确率不高。而半监督网络聚类能够利用先验信息提高网络聚类准确率,但其依赖于先验信息的质量。主动学习可以选择高质量的网络节点进行标记,其不仅保证了先验信息的质量,而且保证了用较少先验获得最大聚类性能提升。因此,面向网络结构发现的主动学习具有重要的研究价值。目前有一些研究者提出了一些用于社区发现的主动学习方法,但其选择的网络节点对具有混合模式的网络结构发现无效。具有混合模式的网络可能不存在社区结构,或存在其他聚类结构,如二分结构、星型结构以及多种结构的混合等。因此,有必要面向网络结构发现目标,设计主动学习算法,提高具有多种聚类模式的网络结构发现性能。本论文主要完成了以下几方面的研究内容:(1)针对面向属性网络分类的主动学习BMAL(Batch Mode Active Learning)算法,在只考虑网络节点链接信息的情况下,不能有效选择使网络结构发现性能提升最大的最优节点集合的问题,提出一种面向网络结构发现的批量主动学习算法BMAL_NMS(Network with Mixture Structures)。该算法基于未标记节点的最大不确定性、最大影响力和最小冗余性三个策略选择最优节点集合。实验结果表明BMAL_NMS算法能够选择使网络结构发现性能提升最大的节点集合。(2)针对BMAL_NMS算法不能充分利用网络节点属性信息的问题,融合网络节点属性信息和链接信息,提出面向属性网络的批量主动学习算法BMAL_CLF(Content and Link Fusion)。该算法采用表示学习将节点属性信息和链接信息表示成节点向量,然后将节点向量作为算法输入,利用目标函数的子模型迭代选择最优节点集合。实验结果表明BMAL_CLF算法优于BMAL_NMS算法。(3)将面向属性网络的批量主动学习算法BMAL_CLF应用于CSDN用户画像中,根据用户的各种行为数据与发表的博客内容数据,选择具有代表性的CSDN用户。并将选择的用户作为先验信息,运行半监督属性网络结构发现算法。实验结果表明BMAL_CLF具有一定的应用价值。
其他文献
本体作为描述一个领域的术语集合,在构建领域知识图谱的工作中具有明显的优势,因此对领域本体概念抽取技术的研究具有重要的意义。在信息抽取的思想中,本体概念抽取可以通过命名实体识别技术来实现。作为信息抽取技术的子任务之一,命名实体识别技术已被广泛应用到各类自然语言处理任务中。随着深度学习的发展,神经网络已经应用到命名实体识别模型中并取得了较好的效果。但在中文领域实体识别任务,尤其是一些专业领域复合实体的
厌氧消化中的水解阶段通常进行缓慢,公认是厌氧消化过程中的限速阶段。污泥的预处理,通过化学和物理作用破坏污泥的结构和细胞壁,使污泥的细胞内物质溶解,从而让污泥迅速水解
新时代背景下,基本公共服务均等化是实现区域协调发展战略目标最重要的抓手。然而,现阶段我国基本公共服务存在规模不足、质量低、发展不平衡等短板,突出表现在基础设施不足、地区间服务资源分配不均、基本服务项目尚未做到全覆盖以及某些地方政府服务不积极等等问题,这些问题已经受到全社会和中央政府的高度重视。我国基本公共服务非均等化问题越来越严重的原因是,区域间经济发展差距不断扩大,使得地方政府财政收支能力差异较
随着市场环境日趋复杂多变,经营理念逐渐向通过供应链上下游合作的发展模式转变。供应链上下游合作密切会为企业带来一些大客户,而大客户会给企业带来一系列诸如降低成本、稳定销售、提升企业知名度等好处,但较高的客户集中度也会为企业实现正常利润埋下隐患,导致经营问题的出现。对于客户集中度较高的企业来水,会由于来自于买方议价能力的压力,在经营过程中受到被侵占利润甚至经营失败的巨大威胁,而导致经营风险的增加。进一
信息熵体系是进行不确定刻画与近似推理的重要理论,已经被引入粗糙集进行数据分析与智能处理.经典的互补熵、互补条件熵、互补互信息能够有效刻画信息的粗糙性与模糊性,但目
废铅酸蓄电池中的铅膏可称为废铅膏,其中含PbSO4(50~65%),PbO2(25~45%),PbO(10~15%),Pb(0.5~3%)和少量杂质。本文研究了废铅膏NaOH脱硫-生物质还原熔炼过程,其目的是开发一种低温
礼与法,作为我国古代治国理政的两种手段,自春秋时期开始相互融合成为我国古代独特的礼法体系。其主要目的是,一方面推行“礼”所倡导的核心价值,即“尊尊”“亲亲”的宗法等级制度。另一方面,完善“法”的赏罚制度来保障“礼”。因此,历代统治者将礼逐步入律,从作为法之注释到礼俗直接编入法典。至清代,尤其是到了乾隆朝时期,统治者意识到礼法体系的维系,仅靠历代传承的礼典和律典自上至下的规范和强制是远远不够的,在相
商业信用是一种由于企业的货物或服务交易与其资金交割之间存在时间差异而形成的短期信用借贷行为。它涉及供应链上“上游供应商——企业”以及“企业——下游客户”之间的交互关系。相关数据显示,近年来上市公司商业信用融资水平虽维持稳定,但商业信用供给水平呈逐年攀升趋势。商业信用越来越广泛地被应用在日常经营活动中。商业信用决策作为公司营运资本决策和公司战略决策的重要组成部分,一定也受到管理层能力的影响。在现实中
冷轧低合金高强钢具有高屈服强度及屈强比、良好的成形及焊接性能等特点,比碳素结构钢具有更高的屈服强度,而较双相钢等先进高强钢具有更低的成本,因此备受市场青睐,广泛应用
医疗救助制度不但保障人民群众最基本的健康权和生存权,而且有助于社会资源的重新调整,缩小群体差距。困难群众作为民政工作的核心群体,由于其经济承受能力弱和健康状况差,该