基于分组特征交互的知识图谱嵌入研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:teamworkhlc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是由实体和关系组成的有向图,图中的节点表示现实世界中的各种事物实体,图中的边表示这些事物实体之间的相互关系。但是知识图谱通常都是不完全的,会有大量的关系缺失,通过人工的方式补全这些缺失的关系,需要消耗大量的人力和时间。因此,知识表示学习被提出来,通过将实体嵌入到连续的低维向量空间中,进而实现知识图谱的自动补全。现在已有很多知识嵌入方法,一般将其分为两大类,第一类是以Trans E为开端的基于平移的Trans系列方法,第二类是以RESCAL为开端的基于乘法的嵌入方法。本文从头尾实体间特征交互方式这一全新角度观察现有方法,现有模型可分为头尾实体间只有对应位特征交互,如Trans E,Trans H,Trans At,Dist Mult,Complx等,另一类则是头尾实体间全体特征交互如Trans R,CTrans R,RESCAL等。只有对应位特征交互的模型参数较少,易于训练,但特征交互少,表达能力较弱。全体特征交互模型表达能力强,但模型参数一般较多,时间复杂度高,模型难以充分训练。针对以上两类方法的缺点,本文提出特征分组思想,头尾实体间组内特征进行交互,使模型既有较好的表达能力,同时在分组大小较小时,模型参数和训练时间与头尾实体间只有对应位特征交互的模型相近,结合了两者的优点。在特征分组交互的思想下,分别提出一种基于平移的模型Group E+和一种基于乘法的模型Group E*,并对两种模型的优势给出充分说明并提供一定的理论证明。进而在常用公开数据集中进行实验,实验结果表明所提出的两种模型的性能优势,从而证明头尾实体间特征分组交互思想的有效性。
其他文献
基于深度学习的3D模型检索往往受限制于有限规模的已标注模型数据,因此现有算法泛化能力有限。域自适应算法可以在有标注域上学习域间共有的知识和模式,从而将其应用于无标注域数据,因此可以有效解决此类问题。本文通过将域自适应算法引入3D模型检索任务,提出了一种基于反向传播的域自适应3D模型检索算法,并基于该算法构建了一个高效的3D模型检索演示系统。通过对比实验,验证了算法的有效性和优越性。首先,通过将基于
人脸识别是指利用计算机系统对输入的人脸进行分析并比较其有效的特征信息来分辨被输入者身份的技术,其中处理人脸差异是人脸识别的关键所在。现有的人脸识别在受限环境下趋于成熟,然而在非受限环境下,人脸会受遮挡、光照、姿态等因素的影响出现差异性,降低人脸识别的性能。研究非受限环境下的人脸差异对人脸识别技术的应用具有重要的实用价值。本文针对非受限环境中的遮挡与姿态因素,通过结合生成对抗网络框架,提出了以下两种
随着智能城市的发展,车辆互联网(IoV)引起了研究者们的广泛关注。智能车辆可以通过多方合作组建车辆团队,在智慧城市中执行移动众包任务。如何组建车辆团队建立安全的模型以实现最大的社会福利,成为车辆移动众包活动中的巨大挑战。尽管目前的研究已经提出了一些移动众包模型,但是很少有人关注实时车辆团队合作。此外,交通压力带来的拥堵为人们生活带来不便的同时也带来了机遇,闲时团队资源的有效利用成为研究者们一个新兴
近年来,众包渐渐成为了一种新的商业模式。众包面向的群体比较广泛,参与到众包平台中的工作者背景知识,专业能力等各不相同,导致众包结果质量参差不齐。因此,质量控制成为众包研究领域的重要分支。目前的质量控制方法大多基于中心化平台,并不能保证完全可信,存在数据泄露,数据丢失等问题。此外,现在的众包平台的激励机制多采用固定定价的方式,这也导致了报酬的不合理分配。为了解决上述问题,本文提出了基于区块链的众包质
当前我国交通基础建设规模逐步增大,互联网的飞速发展也为交通出行带来了更多的可能性。在这样的信息化时代中,面对交通方式的多元化和复杂化,课题组构建了智能情报分析框架IAF,基于复杂网络挖掘算法对地、事、人、行为及相互关系进行感知、理解、预测。其中异常检测是该框架中的关键算法,基于交通复杂网络的情报分析是该框架中的重要功能。本文利用物理空间获取共享单车、网约车等大量车辆的城市交通出行行程数据和轨迹数据
函数名称预测是代码分析中的一项重要下游任务。优秀的函数名称可以增加程序或者代码的可理解性,帮助开发人员轻松的理解他人的代码,这对软件产品的扩展和维护至关重要。近年来,研究人员提出了大量不同的函数名称预测模型,而随着机器学习的发展,函数名称预测方法逐渐从传统的代码分析方向转变到深度学习代码表示上,各种基于机器学习的函数名称预测工具层出不穷。但是在利用机器学习的模型完成函数名称预测任务上,仍然存在两个
截止2019年PubMed数据库中收录的生物医学文献超过了三千万篇,从这些文本中挖掘出有效的生物医学信息用于疾病诊断和新药研发等领域成为研究的热点,而生物医学事件抽取是其焦点问题。生物医学事件抽取的主要任务包括事件触发词和事件元素识别,目前的相关的研究存在未能充分挖掘文本语义特征和数据样本标注不足的问题。针对触发词识别中未能充分挖掘文本语义特征的问题,本文提出了基于多角度学习关键语义信息的方法,该
社会关系的研究在社会学领域中一直是一个重要的话题。随着互联网技术与社会媒体平台的蓬勃发展,越来越多的人活跃在社会媒体中。这为社会关系的研究提供了一个新的途径。人们在社会媒体中的交互是现实社交在网络上的映射,这为通过社会媒体研究社会关系提供了可靠性。并且,海量社会媒体数据也为社会关系的研究带来了极大的便利。本文旨在通过社会媒体数据进行多元化社会关系画像。多元化主要体现在数据的多元化和方法的多元化。数
移动边缘计算是指在移动网络边缘部署存储和计算资源,为移动网络供应云计算能力和IT服务环境,从而为移动用户提出高带宽和超低时延的网络服务解决方案。计算卸载在移动边缘计算中是一项关键技术,可以为资源受限设备运行计算密集型应用提供计算资源,加快计算速度,节省能源。移动边缘计算中的计算卸载是将移动用户终端的计算密集型任务卸载到边缘环境中,弥补了终端设备在计算性能、资源存储以及能效等方面存在的不足。移动用户
云计算由于其强大的计算和存储能力得到了广泛关注,但是远距离传输带来的高延迟对用户体验产生了不利影响,本文通过引入移动边缘计算技术,利用边缘节点天然的地理位置优势,将一个区域内的闲置计算资源整合成一个分布式边缘计算平台,使其提供快速,高效的即时响应。为了解决分布环境中的用户身份安全问题,本文引入区块链技术实现用户之间的可信交易。面对共识过程中产生的“冷启动”和“长期回报”,本文引入银行借贷机制,解决