基于类标依赖性的多关系图多类标分类算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zyfufen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的飞速发展,各种移动互联网应用已经成为人们最重要的信息交互平台,这些信息交互平台将人们串联成各种各样的虚拟社会网络。多个社会网络可以通过节点或关系的映射而形成一个多关系社会网络,通常可以用多关系图来表示。多关系图中节点的多类标分类在网络精准营销、社会网络分析、社会化搜索等领域都有重要的应用价值。在多类标分类问题中,如何有效利用类标依赖性信息对于提高分类算法的性能是至关重要的。在多关系图的多类标分类问题中,类标依赖性信息包括两个方面:隐含在节点内容属性中的类标依赖性和隐含于关系拓扑中的类标依赖性。本文的研究重点是如何有效挖掘这两种类标依赖性信息,并在此基础上设计出有针对性的多类标分类算法。基于内容属性类标依赖性的思想,本文利用类标共现信息来计算类标依赖性,并据此提出了一种基于内容属性类标依赖性的多关系图多类标分类算法(MRML-C)。该算法结合了类标空间聚类划分策略,有效地将多类标分类问题分解为多个规模缩小的子问题,降低了算法复杂度。对比实验结果表明利用类标依赖性进行类标空间划分的策略有效的解决了类标爆炸的问题,并且MRML-C在大多数的数据集上都表现出了较好的分类性能。基于关系拓扑类标依赖性的思想,本文利用类标共现信息和关系拓扑信息共同计算类标依赖性,并据此提出了一种基于关系拓扑类标依赖性的多关系图多类标分类算法(MRML-R),该算法首先会对类标空间进行聚类划分,然而采用问题转化算法将各个多类标分类子问题转化成单类标分类问题,在训练模型的过程中采用了基于随机游走样本抽样方法的随机森林算法,有机融合了关系拓扑信息。最后采用多数投票策略集成各个子空间的预测结果。对比实验结果表明MRML-R算法在二值验证指标上具有更好的分类表现。
其他文献
随着互联网的广泛普及、多媒体技术的逐渐成熟,现实生活中出现了越来越多的群组应用,如股票信息分发、视频会议、付费电视以及镜像同步等等。一般来说,在网络通信方式中单播
从十九世纪末开始,人类社会进入了大发展的阶段,伴随而来的是对能源的需求呈现爆发式的增长,到目前为止对能源的需求仍是与日俱增,可利用的化石能源已经变的相对匮乏,能源危机成为
按需式距离矢量路由协议AODV是一种反应式的路由协议,并已经得到了广泛的应用。但是AODV在链路发生中断时,将从中断的上游节点或源节点重新去寻找新的到达目的节点的路由,这
高血压是一种复杂的疾病,随着高血压疾病发病率的增加,高血压以及高血压的并发症严重威胁人类的健康。因此提高人们对高血压疾病的重视,对高血压疾病的早预防、早治疗起到关
随着手机、PDA、笔记本电脑等移动产品的普遍运用和3G网络环境的日益成熟,人们已经习惯于把图片、音乐、文档等资源存储在移动设备中,以便可以随时查看。这些移动设备可以组
P2P(Peer to Peer)是现今广泛使用的一种网络模型,Chord是一种简单、精确高效率的环形P2P模型,它的查询效率取决于自身所维护的路由表(FingerTable),因此对Chord路由表的研究
情感是人类智能不可分割的一部分,在计算机技术蓬勃发展的今天,用人工的方法和技术,来模仿和延伸人类的情感,使机器具有识别、理解和表达情感的能力,在人机交互、拟人机器人
无线传感器网络(Wireless Sensor Networks,WSN)受目前技术所限,存在着电量有限、计算能力弱、通信能力差、易受攻击等问题,而目前已有的加密方法在应用到WSN时均无法有效解
第四方物流企业通过引入语义网技术和Web服务来提高物流服务的时效性和可靠性。但是目前大量的功能相似的Web服务环境下,如何满足用户日益增长的服务质量的需求是目前研究服务
随着电子行业的快速发展,很多家用电器与工业电器及电力行业中都要用到线圈元件作为其变压器、电感器或音频器等之用。因此,线圈生产在电子行业的生产中占越来越来重要的地位