知识图谱构建中命名实体识别与知识表示学习研究

来源 :河北经贸大学 | 被引量 : 0次 | 上传用户:victinfy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能时代的到来,为充斥在人们生活中的海量、异构、复杂数据信息的有效组织和管理、挖掘并利用其中的隐含知识等,提供了新的机遇与挑战,已成为业界、学术界的热点研究问题。其中,知识是人工智能的基石,因而近年来知识图谱技术应运而生并迅猛发展。知识图谱将各种数据信息组织在一起形成一个庞大的知识库,为机器提供丰富的结构化数据,成为人工智能技术中重要的资源。虽然目前知识图谱取得了较多研究成果,技术逐渐成熟,但在命名实体识别、知识表示方面仍存在一些不足,这直接影响知识图谱构建的质量,因此,命名实体识别与知识表示学习研究成为知识图谱领域研究的热点问题。本文针对知识图谱构建中命名实体识别与知识表示进行了深入研究,旨在提高命名实体识别的准确率,知识表示学习的性能,进而提高知识图谱构建的质量。主要研究内容如下:(1)针对命名实体识别方法中存在严重依赖大量人工特征导致文本特征表示不充分的问题,提出一种基于Seq2Seq模型的命名实体识别方法BERT-Seq2Seq-Attention。首先,利用BRET预训练模型动态生成字的语义向量;然后,通过Seq2Seq模型中的编码器对字向量进行编码,并引入注意力机制为词语分配权重,从而获取文本局部特征和全局特征;最后,将得到的特征输入到解码器中,通过softmax层预测序列标签。实验结果表明,该方法在准确率、召回率与F1值上均有所提升,具有良好的适用性。(2)针对知识表示模型仅对实体间的直接关系进行建模优化,未充分考虑实体、关系的多样性和多步关系路径中隐含的间接关系问题,提出一种基于动态关系映射和路径建模的知识表示学习模型(PDRM)。该模型首先采用TransD模型对直接关系进行建模,并设置动态权重矩阵优化得分函数;其次,利用路径建模获得实体的间接关系,丰富实体语义信息;此外,在模型训练时通过K-means聚类算法构建负例三元组样本,降低错误三元组出现的概率;最后,在两个数据集上验证了模型的有效性。(3)针对信息推荐中数据稀疏和语义信息欠缺问题,提出一种基于知识图谱表示学习的信息推荐算法(SAEKG-CF)。该算法首先将评分矩阵作为栈式自编码器的输入,训练得到项目的隐性特征向量,并据此计算得到特征相似性矩阵;随后,利用知识图谱表示学习模型(PDRM)将项目中的实体映射到低维向量空间,并计算出低维向量空间中实体间的语义相似性矩阵;在此基础上,将特征相似性矩阵与语义相似性矩阵相融合,得到融合相似性矩阵,进而依据最优融合相似性矩阵产生top-k推荐列表。(4)基于服务统计数据信息,构建了智慧服务平台系统,成功的将前述研究成果应用于系统中的知识问答和服务信息推荐模块。
其他文献
2019年,成都市青羊区就业局围绕国际化营商环境建设大局,秉承为企业服务的主体意识,以"惠企利企便企"为工作主线,通过深化"放管服"改革、强化服务意识、促进企业在职人员职业
在磁性研磨研究中磁路设计是重要组成之一,其形成磁场对研磨质量影响很大.本文根据电磁场理论,对直流激磁磁路的设计进行了分析,并就磁路设计中重遥.数之一的磁导进行了精确
当今时代,人才与科技竞争异常激烈,教育领域正在进行一场意义非凡的改革,主张培养全方面高素质创新人才。学校作为人才培养的重要基地,教师在传授知识和技能的同时,更要积极思考对学生科学思维的培养。费米问题因其与生活的息息相关以及解题过程中的思维过程,可能有利于学生科学思维的培养。在此背景下,本研究选取某校高一学生为研究对象,采用文献法对相关资料进行收集,调查法对学生和教师进行调查以了解科学思维现状,并通
本翻译实践报告的原文本为詹福瑞先生所著的《中古文学理论范畴》第三章的第一、二小节。《中古文学理论范畴》以中古时期文学理论范畴作为研究对象,全书分为四章,主要阐述了文德、文术、文体、文变四大理论范畴的产生、形成和发展。翻译作为跨文化活动,其难点不在两种语言形式上的差异,而在语言背后丰富的文化内涵。《中古文学理论范畴》是一部专门研究文学理论范畴的专著,其中涵盖了大量内涵丰富的中国文化专有项。由于中西文
近年来,激光在信息技术、电子电路、医疗器械、焊接加工等领域的应用越来越广泛。实际中激光器发出的光束其横向分布具有高斯特性,限制了其应用范围。因此对于特定的使用场景,需要对激光光束进行整形处理,以获得特定能量分布形式。本文以单模高斯光束整形为平顶光束为例,对基于相位调制的空域光束整形匀化技术进行了研究和分析,分别对微透镜阵列匀化系统及液晶空间光调制器匀化系统进行了仿真分析,设计了实验对仿真结果进行验
黑政办规[2018]38号各市(地)、县(市)人民政府(行署),省政府各直属单位:《黑龙江省信访事项复查复核办法》已经省政府同意,现印发给你们,请认真贯彻执行。2018年7月2日黑龙江
期刊
A  阅读下面短文,从短文后所给各题的四个选项(A、B、C和D)中,选出可以填入空白处的最佳选项。  A young man was getting ready to graduate college.For many months he had__1__ a beautiful sports car in a dealer’s showroom,and knowing his father co
期刊
为坚决打赢疫情防控阻击战和推进经济社会发展工作,减少疫情对中小微企业的经营冲击,确保经济社会持续健康发展,宜宾市南溪区就业创业促进中心强化风险意识,主动担当作为,通
随着网络文本信息容量的不断提高,快速且高效地识别出这些文本中所包含的实体信息,对各行各业都具有很重要的意义。命名实体识别是自然语言处理的基础任务之一,对信息抽取、文本分类、对话系统和机器翻译都具有非常重要的影响。探索高效的命名识别方法,成为学术界和工业界关注的热点问题。本文主要针对英文和中文命名实体识别(NER)进行相关的研究,主要研究内容如下:1)本文提出一种基于S-LSTM构建了英文NER新的