【摘 要】
:
知识表示学习的目标是将知识图谱中的实体和关系表示成稠密低维的向量。目前翻译模型是知识表示学习的代表性模型。基于翻译规则的模型通过优化成对排序函数使得正样本与负样本尽量分离。优化目标决定了翻译模型的训练过程离不开负样本参与,因此负样本的质量对模型训练起到非常重要的作用。然而已有的工作很少考虑负样本的生成策略,大部分基于翻译规则的模型在训练时采用随机替换事实三元组的头尾实体得到负样本,这种负样本生成方
论文部分内容阅读
知识表示学习的目标是将知识图谱中的实体和关系表示成稠密低维的向量。目前翻译模型是知识表示学习的代表性模型。基于翻译规则的模型通过优化成对排序函数使得正样本与负样本尽量分离。优化目标决定了翻译模型的训练过程离不开负样本参与,因此负样本的质量对模型训练起到非常重要的作用。然而已有的工作很少考虑负样本的生成策略,大部分基于翻译规则的模型在训练时采用随机替换事实三元组的头尾实体得到负样本,这种负样本生成方法会得很多到低质量的负样本,导致模型收敛速度变慢;并且现有的负样本生成策略均未考虑知识图谱中潜在的噪音和知识图谱本身所具有的社区结构信息。为解决上述问题,本文主要做了如下工作:(1)提出一种基于置信度的负样本生成策略。在带有噪音的知识图谱中提出了负样本置信度概念,在此基础上,进一步提出了一种考虑置信度的负样本生成方法,然后将这种负样本生成策略用于知识图谱中的噪音检测,在带有不同噪音比率的标准数据集中取得了较高的表示模型精度。(2)提出基于社区结构的负样本生成策略。即针对实体稠密的社区与实体稀疏的社区,分别设计不同的负样本选择策略,实验验证了该策略的有效性。
其他文献
城市管道泄漏长期以来是供水系统的致命难题,管道发生泄漏的原因有很多种,例如环境因素、人为因素,材质因素等。塑料管道泄漏检测主要基于声学检测,该检测方法的相关研究与应用仅考虑了埋地管道单点泄漏情况下,然而并未考虑到管道存在暗漏时不及时处理,长期的泄漏会导致管道周围介质发生变化,导致检测结果产生误差。结合埋地供水管道单泄漏信号的理论研究,论文基于互相关时延算法,分析了水下充液管道发生单、多源泄漏时,塑
遥感技术是一门涉及到多种领域的综合性探测技术,能把接收到的地物所辐射的电磁波信息进行不同方式的处理,从而观测和识别各类地物和相关现象。该技术在很多领域都有应用,已经成为测绘和规划、地球环境资源调查领域应用过程中不可缺少的有效手段。遥感影像的分类与制图为制作或更新地图和专题图提供了重要的技术手段,为各行业的发展提供了真实、可靠的信息,是地理监测、生态保护等工作的基础。本文着重研究了模糊聚类算法和特征
在中央关于振兴东北老工业基地战略的指引下,东北地区改革发展进一步加快,呈现出前所未有的活力。振兴东北,首先要振兴东北城市,发挥城市对振兴东北的带动作用。而作为城市
漫天瑞雪,迎来了兆示祥和和丰收的2005年.<上海企业>将以它崭新的改版,展示它新的追求.思索良久,新版卷首若就党的十六届四中全会提出的构建社会主义和谐社会的命题,而一吐着
背景:乳腺癌是全球三大最常见的癌症之一,同时也是女性肿瘤相关死亡率最高的一类疾病。研究表明,基于乳腺癌分子亚型在临床上被用于选择最合适的治疗方法,并已被证明对个体化
目的:探索咳嗽变异性哮喘和感染后咳嗽风咳证异病同治临床治疗法则的可行性,以及篮式设计方法对异病同治研究的意义;探索申春悌教授疏风祛瘀化痰治疗法则对风咳证的临床疗效