融合时域网络与蒙特卡洛树搜索的知识图谱补全模型研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:qq237599512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络,知识图谱等在大数据时代都变得至关重要,然而,与图片和视频等欧几里得式数据不同,交错复杂的非欧几里得式结构数据面始终具有特征提取困难的问题,复杂的数据交互形式和庞大的数据体量,使得对网络结构数据的挖掘和分析变得相对困难。传统的网络结构数据挖掘通常采用表示学习方法,即将网络中的节点和关系获得嵌入向量,向量的方向和模长均具有表示意义。另外,随着强化学习方法的兴起,出现了将强化学习模型应用于网络结构数据处理数据挖掘任务。本文面向知识图谱以强化学习视角对数据分析与挖掘,其中一个主要问题是知识图谱实体补全问题。因此,本文以知识图谱补全任务入手,其任务表述为给定初始实体和该实体相关的关系,补全出关系对应的目标实体,构成完整的(头实体,关系,尾实体)三元组。该任务可应用于知识图谱补全,问答系统,推荐等诸多下游任务。本文将补全任务过程形式化定义为马尔科夫过程,采用强化学习思想学习解决补全问题,其中的网络特征提取与策略学习方法能够适应多种任务。首先,本文详细定义了知识图谱补全任务的马尔科夫过程,明确了过程四要素即状态空间、动作空间、转移函数和回报函数,进而使得该过程能够以强化学习方式对任务目标学习。然后,本文构建深度智能体网络(Graph-Agent,GA)用以学习环境中的不同状态下的动作决策策略,其中针对状态的序列化问题提出基于时域卷积网络的状态特征提取层网络;针对不同状态下动作空间不定问题提出基于共享参数的完全动作空间映射和灵活的策略层网络,共同组成完整的强化学习中的深度智能体网络。深度智能体网络对于环境的探索过程采用智能体决策结合蒙特卡洛树搜索方式以获取训练数据,解决了图结构数据上游走采样的低回报率问题,并采用轨迹存储池和离策略训练智能体对补全模型进行更新。最终,模型的预测阶段采用与探索过程相似的Q值结合蒙特卡洛树搜索方式,对搜索结果以加权评分排序。实验在NELL995的十个关系数据集和WN18RR数据集上进行,并采用平均倒数排名(MRR),HITS@K,平均精度均值(MAP)等信息检索评估算法,对模型效果进行验证,同时与目前在该任务上常用的三类算法中的经典算法进行比较,并对模型的可解释性进行了一定分析。模型中状态编码网络的训练速度相较于循环神经网络模型有着较大的提升。实验结果表明,在NELL995的十个关系数据集上预测的平均MAP达到89.9%,在WN18RR数据集上预测的MRR达到43.5%,模型的评估在部分任务上取得了与其他方法接近的效果,在多个补全任务上取得最优的效果。
其他文献
Avago Technologies是一家为通信、工业和消费应用领域提供模拟接口零部件的领先级供应商,近日宣布推出可以提高数据中心交换效率和带宽的光纤模块方案。新推出的可插拔平行光
运用问卷调查法、专家访谈法、数理统计法对一些高中学校学生、家长及这些学校的老师就体育优胜者高考加分这一政策及实施相关问题进行调查。调查认为:学生参与体育高考加分比
杰出的中年水彩画家宋守宏张克让《宋守宏水彩画集》已出版发行。该集精选宋守宏同志从60年代至90年代有代表性的水彩画作品30余幅。古老秀丽的江南水乡,朴实的旧街小巷,繁忙的海港码
近年来,随着基础教育的深化改革,互动式教学受到越来越多的关注和应用。互动式教学相比于传统教学,更能够体现出课堂教师主导、学生主体的教育定位。与此同时,课堂中良好的师生、生生互动不仅有利于促进教师的教和学生的学,而且利于构建充满生机的课堂教学。初中《道德与法治》课程作为青少年德育工作的重要组成部分,承担着立德树人的根本任务。作为一门德育性和教育性相结合的特殊学科,加强当前《道德与法治》课堂中多维互动
我国的电子商务发展水平已经处在世界领先地位,不仅出现了如淘宝网、天猫商城和京东商城这一类在国内外都较有影响力的电子商务平台,还有每天都在更新换代的一些中小型电商企业,这些平台发展速度飞快,发展领域更是涉及人们生活中的方方面面。但是各种经济与技术的发展也加剧了社会矛盾,所以急需构建多元化的纠纷解决机制来适应矛盾多元化且复杂化的社会。虽然我国的电子商务经济已经发展到了较高的水平,但是在构建纠纷解决机制