【摘 要】
:
图数据是一种由顶点和边构成的抽象的数据结构。随着信息科学技术时代的发展,研究人员发现图数据有强大的表示能力,可以对许多不同的领域里拥有复杂结构的数据进行建模,例如,生物信息学中的DNA、蛋白质,化学信息学中的化合物,计算机科学中的社交网络、知识图谱。如何对图数据进行分类成为研究的热点。在部分实际应用中,我们只能标记一部分图数据为正类,其他实例都未能作标记,这被叫做正类和无标记的(PU)图数据分类问
论文部分内容阅读
图数据是一种由顶点和边构成的抽象的数据结构。随着信息科学技术时代的发展,研究人员发现图数据有强大的表示能力,可以对许多不同的领域里拥有复杂结构的数据进行建模,例如,生物信息学中的DNA、蛋白质,化学信息学中的化合物,计算机科学中的社交网络、知识图谱。如何对图数据进行分类成为研究的热点。在部分实际应用中,我们只能标记一部分图数据为正类,其他实例都未能作标记,这被叫做正类和无标记的(PU)图数据分类问题。然而,目前图数据分类方法大多是基于训练样本中含有正例和负例进行分类器的学习,不适用于PU图数据分类问题。此外,现有的图数据分类方法多数是基于图数据的单个视角特征进行模型的学习,模型分类准确度和泛化能力稍显不足。针对PU场景下需要怎么样的图数据分类器,如何提高对于图数据分类问题的准确度,对于训练样本里只有PU图数据的状况下如何提高模型性能等问题,本文提出一种基于多视角学习的PU图数据分类的新方法(MVPUG)。与一般的分类方法不同,本方法可以通过计算图数据的分数,以获得图数据预测准确度的排序,可以协助研究者在PU图数据的分类场景下,优先处理预测准确度高的数据。本文的工作和贡献的概括如下:(1)提出一种新的用于PU图数据分类的模型。该分类器模型引入了一个新约束从而令模型可以在图数据的不同视角中尽可能得到一致的分类结果,以满足多视角学习中的原则。另外模型还结合成分敏感的策略,引入一个新的约束令模型对两个相似的图数据尽可能得到一致的分类结果,从而利用无标签的图数据之间的相似性提高分类性能。(2)提出一种该模型的分类框架。该分类框架首先根据训练样本的标签构造新的图数据集合,并采用不同的图数据特征提取方法生成图数据的多个视角,最后通过交叉验证学习模型的评分函数并寻找最优的分类器。在预测阶段,分类框架首先构建图数据的多个视角,然后用分类器模型计算待分类图数据的得分,最后根据得分对图数据进行分类。(3)为了验证提出的方法和模型的性能,本文做了充分的实验,使用了多个不同类型的真实图数据集来进行实验,并与现有的分类方法进行比较。实验结果表明,对于PU图数据分类问题,本文提出的模型和方法有更好的表现。
其他文献
人们日益增长的通信需求极大促进了移动通信系统的更新换代。在全球加速部署的第五代移动通信系统根据频率可划分为FR1的Sub-6 GHz和FR2的毫米波两个大类,其中的毫米波频段由于其传播特性及技术瓶颈而被暂时搁置,并且正在进行关键技术的研究,因此Sub-6 GHz频段成为了各个主流国家部署5G的首选频段。选用Sub-6 GHz作为5G的初期建设频段能够有效减少基站部署成本,加速5G网络部署速度的同时
知识图谱被定义为包含多类型节点和多类型边的多关系图,它实际上是一个语义网络的知识库,如今已广泛地应用在证券投资、搜索、自适应教育、大数据风控、聊天机器人、智能医疗、推荐系统等领域中。如何采取有效的辅助信息去改善协同过滤推荐系统的性能成为研究的热点。目前,改善的主要方法有在推荐系统中引入如深度学习、神经网络、知识图谱等辅助信息,相比其他辅助信息,知识图谱不但能够使实体之间具有更加丰富的语义关系,从而
自动引导小车(Automatic guided vehicles,AGV)被广泛地应用于无人生产车间,以完成生产物料在给定派单下的自动搬运,是现代智能工厂的重要组成部分。对于物料运输任务的快速性、准确性要求,AGV需要具备能够高效地完成路径寻优,并跟踪最优轨迹的能力。本课题主要研究的是将最优控制的理论方法结合深度学习方法,应用到AGV轨迹规划中,做到实时最优控制。传统最优控制方法用于轨迹规划问题求
能源匮乏和环境污染是全世界面对的问题,开发和利用可再生能源发电是改善环境的有效方法。然而,由可再生能源发电构成的微电网系统容易受到气候和环境变化的影响,导致发电具有随机性,因此需要对微电网的能量进行优化管理。本文对可再生能源发电和负荷进行预测,通过能量管理策略实现微电网的能量管理。首先,描述了分布式电源的数学模型和微电网能量管理模型。针对可再生能源发电和负荷的随机性问题,分别采用指数平滑法、灰色预
由于受到生产产品等各方面需求的推动,很多专用设备逐渐向重型化、大型化的方向发展。大型设备系统结构复杂、集成度高,万一发生停机甚至出现重大事故,将会造成极大的经济损失。为了避免事故的发生,目前针对大型设备的维护手段基本以计划性维护为主,维护策略相对保守,多数更换下来的设备仍存在一定的剩余使用时间,资源利用率低。维护技术经历了故障检修、预防性维护等历程,目前已进入智能维护研究的阶段,主要分为基于模型驱
室内气体定量分析在仿生嗅觉中是一个热点应用领域,对于人们健康有着非常重要的意义。如果能够有效地提取在不同干扰情况下的混合气体的特征,这对于实际环境中的应用具有重要的作用。传统的室内气体分析主要是理化鉴别法,存在着技术门槛高,实时性差的缺点。本文的目的是探索使用深度学习对混合气体进行定量分析的方法,对比目前仿生嗅觉已有的模式识别算法,研究对象为电子鼻采集的室内有毒有害的甲醛混合气体数据,综合考虑了不
去雾一直是提高图像质量领域的重要研究方向之一,遥感图像去雾更是对后续遥感图像处理有着举足轻重的作用。获取遥感图像的硬件限制以及成本限制更是对提高遥感图像质量有更高的要求。遥感图像中雾气浓度不均匀、地物信息复杂以及数据集稀少的问题使得目前主流的适用于自然图像去雾的方法并不适用于遥感图像去雾,并且遥感图像中雾气浓度过浓容易造成遮挡问题,导致提高图像质量后该部分的信息依然模糊。因此针对以上问题,本文所做
重载叉车是一类非常重要的港口起重设备。它利用伸缩臂实现大范围叉装货物的功能。随着对伸缩臂可覆盖范围和叉装货物载重等需求的提升,对伸缩臂的强度和疲劳寿命也有更高的要求。车架是重载叉车的主要承重部件,其强度和疲劳耐久性也是设计中必须考虑的因素。伸缩臂是双向压弯构件,其载荷形式主要是臂节之间的接触载荷。车架与其他部件的连接都是铰接形式。依据伸缩臂和车架的不同载荷种类,应用不同的方法建立动力学模型以及计算
随着我国高速铁路技术迅速地发展,我国现已全面掌握高速铁路关键核心技术,与此同时针对动车组列车的相关配套检修技术也在不断的升级、完善。目前我国的动车检修已经逐步从人检人修朝着机检人修的过程发展。轨道列车一级检修作为目前我国完整的一套检修服务体系中检修周期短、检修频次多的一项检修任务。它直接影响到动车组列车在运行中的安全与效率。同时又由于车轴是列车运行过程中重要的支撑荷载零件,所以在进行智能检修过程中
离散事件系统是一类由离散状态、事件转移构成的系统,其专注于系统的序列化行为以及逻辑性。而故障诊断一直以来都是离散事件系统的热门研究方向。早在90年代Lin就提出了一种基于状态的离散事件系统在线诊断和离线诊断,接着Sampath提出可诊断性形式化定义后,故障诊断这一领域研究备受国内外专家学者关注。并从经典离散事件系统推广到模糊离散事件系统、随机离散事件系统、分布式离散事件系统、赋时离散事件系统等多种