基于种子节点选择和链路预测的多标签分类算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:a3321697
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网等信息技术的发展,网络数据挖掘占据着越来越重要的地位,并成功应用于用户行为分析,文档分类,图像分类等领域。分类问题可以进一步分为单标签分类和多标签分类。分类任务中,当分类对象属于多个候选类中的一个类别时,该问题称为单标签分类;当分类对象属于多个候选类中的多个类别时,该问题称为多标签分类。集体分类方法将网络中的边视为同质的,能够对相互连接的多个实体同时进行分类,可以取得较好的分类效果,主要适用于同质信息网络中的单标签分类问题。然而现实世界中,人们经常面临的是多关系网络,网络实体一般同时拥有多个标签,实体间的链接往往代表不同的语义含意,链接的类型多种多样。集体分类无法区分多关系网络中边的异构情况,难以获得较高的分类准确率。多关系网络环境下的多标签分类问题,目前已取得了众多学者的广泛关注,并得到了广泛的研究。已有的方法中,通常都是从网络中随机的选取节点作为训练集,分类结果不稳定,分类精度不高。本文借鉴了主动学习思想,提出了SHDA算法,利用网络的拓扑结构,将网络划分为多个affiliations,从每个affiliation中按比例的选取度数高的节点,最后将选择的节点合并处理后得到种子节点。对种子节点进行预先标注并作为训练集进行多标签分类,能够使得分类算法以最小的样本获得最高的分类精度,提高多标签分类的准确率。现实生活中的网络数据可能存在不完备,不全面的情况,网络数据不一定能真实的反应现实世界中实体间的关系。针对这种情况,我们提出了LP-SCRN算法,使用偶数步的链路预测算法为网络预测出部分缺失链接,然后利用实体间社会特征的相似度为预测出的链接赋予权值,根据归一化后的链路权值,结合实体邻居的标签,实体的类传播概率,使用标签松弛法迭代的计算实体属于各个类的概率,最终预测出实体的标签。LP-SCRN算法将链路预测与多标签关系邻居分类器结合起来,真实数据集上的实验表明,该算法能够提升多关系网络中多标签分类的准确率。
其他文献
随着触摸屏手写技术的不断提高,集数字文具和数字教具于一体的文字书写学习系统的研究开发,不但是技术发展的必然,也可为两型社会的建设作出重要贡献。开发具有教具功能的规
在过去的十几年中,随着生命科学的迅猛发展,各种相关的数据呈现爆炸式增长,互联网上涌现出了大量的生物信息数据库及数据分析工具。生物学家和生物信息学家在实施数据检索或
近年来,计算机视觉等理论的发展给视频编码的研究工作带来了新的启发。从主观评价角度出发,根据人的视觉特性重点关注视频中的特定区域的信息、提高编码效率和编码结果的质量
随着互联网信息技术的不断发展,各种基于企业和政府内网的B/S应用不断涌现。这些应用由于各种原因如安全、保密等因素不对外网开放,但同时又积累了大量的数据。如何让用户快速
帧率转换技术主要用来实现不同视频源帧率之间的转换,随着高清数字电视和多媒体系统的迅猛发展,如何提高视频源的帧率满足人们高质量的视觉享受,成为了人们研究的热点。常用
扫描仪作为一种图形图像输入设备在国内军事、测绘、建筑方面等特殊领域的数字化应用有着广泛的需求。随着用户对扫描仪色彩质量的要求越来越高,在现阶段,提高扫描仪的图像还原
近年来,P2P网络一直是工业界和学术界重点关注的对象。P2P网络结构作为P2P网络的基础,具有重要的研究意义。混合式P2P网络结构是目前研究的热点,其中群内超级节点选取、群的
随着网络技术的不断更新和发展,以及IPv4网络地址的不断耗尽,IPv6作为下一代网络的核心技术必将替代IPv4技术,但从IPv4网络过渡到IPv6网络不是在短时间内能完成的,它必将经历一个
海运物流是一种集装箱化的物流,具有集装箱化、标准化、全球一体化运输模式等特点,从为货主、货代、船东提供高效、便捷以及低成本订舱服务的理念出发,以实现整合海运物流行
似物性采样是提取一幅图像中可能成为任意目标的窗口,在目标检测与识别时,可显著减少目标的搜索窗口,相比滑动窗口而言,还可有效提升检测窗口的精度。近年来,在目标识别领域,