【摘 要】
:
知识图谱的构建,是要将所需领域的实体的相关信息以及关联关系等各类信息,以RDF三元组的形式存储到一个具有存储、高效检索的图数据库中,并根据需求能够实现特定路径的一个过
论文部分内容阅读
知识图谱的构建,是要将所需领域的实体的相关信息以及关联关系等各类信息,以RDF三元组的形式存储到一个具有存储、高效检索的图数据库中,并根据需求能够实现特定路径的一个过程。对于知识图谱的构建,相应领域的信息抽取是重中之重。知识抽取主要讲的是实体属性和关系的抽取,通常情况下是一个句子级别的抽取过程。事实类文本中,大部分句子无法用于关系抽取。为了提高自由文本的利用率,可以将涉及实体的动作信息保存下来,或者根据已有需求快速的构造一个特定关系的抽取器。本文主要的研究方向,是提高非结构化文本的利用率,丰富知识图谱,为知识图谱提供数据基础。主要工作包括,第一,设计了一种基于开放域抽取的实体行为抽取框架。无法被关系抽取利用的表示实体行为的文本,进行实体行为抽取。第二,设计了一种基于人机协作的实体对特定关系抽取框架。需要抽取一种新型关系时,能够凭借少量标注数据以及用户协助过程,不断迭代构成新的分类器,提高特定关系的抽取性能。第三,实现了一种基于物理特征和语义特征输入的双向LSTM网络关系抽取模型。在LSTM网络的输入上增加物理特征和语义特征,可以将分类过程从句子级别变为实体对级别,针对句子中不同的实体对可以得到不同的分类结果,有效提高了准确率。
其他文献
<正> 根据THIO技术评价方法,技术能力(记作A)是指创造、适应、改进技术的能力,其评价指标为技术含量I1、技术状态I0、技术发展基础结构I2。I1、I2、I3的权重向量为(0.5,0.25,0.2
文章分析我国医疗费用的主要影响因素,在此基础上提出控制医疗费用不合理增长的建议。运用多元线性回归模型,对1995~2011年的有关数据进行定量研究,确定我国医疗费用的主要影
本文运用组织行为学的理论,以典型的温州家族企业为例,针对其普遍存在的员工主动离职率较高的现象,定性调查访谈100多位在家族企业中的任职的职业经理人从上任、在职、离职的
本文综合国内外地下水源热泵研究现状,通过对北京地区地下水源热泵利用现状调查分析,重点分析了地下水水源热泵利用过程中存在的不能完全回灌、回灌水温差过大、水井布设不合
随着综艺节目的大热,好的综艺节目即使在没有前期大量宣传的前提下,也逐渐受到观众的喜爱,这与其内容中传达的人性内涵有密不可分的关系。本文将解析综艺节目中从参与者背后
结直肠癌筛查是防治结直肠癌的有效措施,但目前尚未普及。McGregor S、Hilsden R及Yang H为了解医师对此的态度及实施过程中所面临的问题,在加拿大的亚伯达省对初级护理医师
随着信息技术飞速发展,公益事业领域不断发生着创新与变革,互联网公益兴起。互联网公益具有广泛性、便捷性和国际化等特点,个体通过在线捐赠和转发公益信息(通过社交媒体参与公益的一种新行为)参与其中。然而,由于监督审核机制不完善等原因,互联网公益的发展也伴随着许多问题,如骗捐事件层出不穷、虚假公益信息快速传播等,这对社会爱心、公众信任造成了严重的伤害。本文基于启发式——系统式模型和信息诉求理论建立研究模型
《高等学校英语专业英语教学大纲》提出英语专业应遵循“英语+专业+技能”的人才培养模式,向社会输送一专多能的应用型人才。基于吉首大學应用英语专业学生現狀,本论题通过对
在新课改的深入推动下,初中物理教学备受关注,积极摒弃传统的教学方式,引入全新的教学理念与手段已经成为了当前的关键所在,其中探究式教学方法符合时代发展的要求,不仅可以
近年来,制药行业污水排放要求日趋严格,常规的生化二级处理难以达到处理目标,无论废水采用何种排放方式,都需要采取措施加强废水的处理效果。在废水深度处理的各种工艺中,强