基于分布表示的实体集合扩展

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:ytrewq123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会上的信息总量呈指数增长,知识库由于其解决信息过载的能力越发受到关注。知识库以图的结构存储了以实体为节点、以关系为边的结构化信息。实体集合扩展是知识库完善的一项重要任务,该任务关注于实体类别这种节点内的一元结构信息,是知识库完善的重要组成部分。分布表示和神经网络在自然语言处理领域获得了很大成功,而在实体集合扩展方向相关研究还不深入。本文深入研究基于分布表示的实体集合扩展,使用基于分布表示的神经网络模型以及基于弱监督的细粒度实体分类技术,识别句子中的实体所属类别集合。本文主要的研究内容和成果如下:1.本文设计实现了基于多层感知器的实体集合扩展模型,同时实现了基于语义语法特征的模型进行对比,多层感知器模型配合弱监督的实体分布表示,在避免了人工特征的基础上,在召回率上有了更好的表现。2.本文研究设计实现了基于卷积神经网络的实体集合扩展模型,在参数规模减小的情况下捕捉到更多信息,在提高召回率的同时避免了精度的损失,从整体上提升了模型的表现。3.本文设计实现了基于循环神经网络的实体集合扩展模型,模型使用双向的LSTM网络来表示上下文特征,能够更好的表达较长的文本环境特征,同时能够关注于有用的信息避免引入过多噪声,该模型在精度、召回率等各方面表现均超越了其他模型,表明该模型能较好的解决实体集合扩展问题。
其他文献
湿地系统是全球自然生态环境的重要组成部分。黄河入海口地处海陆相互作用的敏感地带,因为海水波流动力会对此地区造成侵蚀,所以湿地资源会频繁变化,保护湿地资源多样性具有特殊意义,故该地区的湿地研究具有极大的生态和经济价值。高光谱遥感影像图谱合一,有利于湿地的分类识别研究。本文以黄河入海口湿地为研究区域,以新获取的“珠海一号”高光谱遥感影像数据为数据源,探讨针对湿地类型新数据的适用性,并基于高光谱遥感影像
养老基金是当今民众缴纳的基本社会保障金之一,是民众退休生活的主要经济保障,对我国经济发展与社会稳定具有十分重要的意义。随着经济的崛起与国家的发展,我国人口比例出现失衡,老龄化问题愈发严重,同时经济市场出现较高的通货膨胀率,故而传统的养老基金管理方式使养老基金大幅贬值。将养老金投资于金融市场不仅能在一定程度上实现养老基金的保值增值,同时有助于经济的平衡发展。因此本文考虑养老金的投资管理问题,经过演算
地下水具储量大、分布广、水质好、便于应用等特点,在水资源供给中扮演不可或缺的角色,同时地下水循环也是自然生态演化中极为重要的一环。目前地下水资源开发不合理,致使区域水位持续下降,所带来的次生环境地质问题频频发生,如地面沉降、生态植被退化等。合理利用地下水资源,平衡发展与生态系统间的矛盾是亟待解决的问题。雄安新区是国家重点规划新区,作为我国未来城市发展模板,地下水是其建设发展的重要支撑,分析该地区地
近年来,空间机械臂依靠自身高灵活性等特点在空间探索活动中起着不可替代的作用。利用空间机械臂能够完成诸如空间舱体组装,大型设备搬运等大负载操作任务,同时考虑到机械臂
新型保温承重一体化装配式复合墙体(下文简称新型复合墙体)本文专指带有连接件的泡沫混凝土轻钢龙骨复合墙体,该墙体以冷弯薄壁轻钢龙骨为主要承重构件,墙体临室内侧直接利用自攻螺钉连接蒙皮板作为免拆模板,临室外侧利用连接件连接蒙皮板作为免拆模板从而形成墙体空腔,浇筑泡沫混凝土之后形成整体。新型复合墙体通过控制连接件长度来控制墙体保温,通过控制轻钢龙骨截面来满足承重要求,从而实现了保温承重双控理念。本文主要
双边投资协定是两国间签署的、用以协调投资关系的规则,是投资者向东道国进行投资最主要的法律依据。在国际投资不断发展的当下,投资者与东道国间的投资争端日益增加,如何在双方主体地位不对等的情况下,化解争议、解决争端、切实维护利益,是当下必须关注的。也鉴于此,双边投资协定往往将仲裁作为维护投资者利益的重要途径。在投资者因受到东道国政府征收征用、国家战争、政策变动、政府违约等行为带来的投资损失时,有权通过仲
移动IM (instant messaging)系统是在移动端上使用的即时通信系统。在“互联网+”的时代下,越来越多的企业使用IM系统以提高工作效率,然而IM系统对服务器的带宽、CPU等资源的
《元曲選》是明人臧懋循編訂的一部雜劇選集,其中的賓白部分經過臧氏的修改,在保留元代語言成分的基礎上,又體現了明代語言特色,是我們研究元明時期語言演變的重要資料。本文
近年来,我国探索太空的活动越来越频繁,空间机器人的应用也越来越广泛。空间机器人主要工作在太空中,但又要经受地面发射环境的考验,同时由于一些在轨操作任务需要采用复杂的
设备直通技术(Device to Device, D2D)的核心思想是在终端之间建立直接通信链路完成通信。在蜂窝网络中引入D2D通信,可以更好地减轻基站负荷、覆盖网络盲区并增加网络总吞吐