细粒度空间关系抽取技术的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:tomzhang155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言是人类描述空间信息的重要方式,文本中蕴含了丰富的空间信息,从文本中高效、准确地抽取出有用的空间信息,对于问答系统、知识图谱构建、地理信息系统等许多相关应用有所助益。ISO-Space是当前较为完善的面向文本的空间信息标注规范,定义了空间元素和空间关系的概念,空间元素是基本的语义单元,空间关系描述了空间元素间的语义关联。自然语言在表达空间信息方面表现出多样性,这给空间信息抽取任务带来了极大挑战。本文基于ISO-Space,对面向文本的细粒度空间关系抽取技术开展研究,研究工作包括如下几个方面:本文研究了细粒度空间关系抽取任务,对于给定文本和标注好的空间元素,抽取出文本中的空间关系及其细粒度类型属性。针对该任务,本文提出了基于依赖识别的空间关系抽取方法DI4SR,抽取过程主要包括两阶段:首先利用基于深度自注意力神经网络的依赖识别模型识别出空间元素对之间的语义依赖,然后将语义依赖按照预定义的规则方法组合为完整的空间关系。该方法在Space Eval评测任务上取得了很好的效果。DI4SR方法识别细粒度类型属性时未能充分利用空间关系中的所有角色信息,因此本文提出了细粒度空间关系分类方法(FGSRC),使用深度自注意力神经网络对空间关系进行特征表示,识别其细粒度类型属性。实验表明,对于细粒度空间关系抽取任务,DI4SR+FGSRC方法相较于单一的DI4SR方法取得了更好的结果。本文还研究了端到端的细粒度空间关系抽取任务,直接从未标注的文本中抽取细粒度空间关系。针对该任务,本文提出了基于多任务学习的联合抽取框架,以充分利用相关任务间的潜在相关信息。实验表明,基于多任务学习的联合抽取框架的抽取效果好于传统的流水线抽取框架。
其他文献
自进入新世纪以来,电磁污染日趋严重,被世界环卫组织列为仅次于水,电,噪声之后的世界第四大污染源。全球每年因电磁污染对一些电子仪器设施造成的损伤达到数十亿美元以上,而且对人体的损伤更是不可估量。因此,吸波材料的研发一直是一个焦点话题。随着材料科学的发展,新型材料逐渐取代传统材料。石墨烯因为其电子迁移率高,密度小,是一种性能优越的介电损耗吸波材料,在众多碳材料中脱颖而出。本文利用石墨烯的大比表面积特征
近年来,伴随着互联网的高速发展,位置数据的价值显得尤为重要。现如今,基于位置服务的需求不断激增,无论是室外道路以及行程规划、大型商场的室内商铺导航,还是在工业、农业等生活领域外的其他领域,皆需要基于位置的服务。然而不同于发展较成熟的室外位置服务技术,室内复杂的空间状况使其无法应用现有的室外服务技术。国内对于室内位置服务系统的研究相比于国外起步较晚,研究程度也略显不足,因此,设计并开发一套完整的室内
淮山(Dioscorea opposita Thunb),又名山药,是我国备受消费者青睐的药食两用食物资源,具有重要的营养和经济价值。淀粉是淮山中主要营养物质,由于作物品种和生长环境的不同,天然淀粉颗粒的性质具有很大的差异,而目前关于南方的淮山淀粉的特性研究还比较少。因此,论文以木薯、红薯、香芋淀粉为对照,选择了9个具有南方特色的淮山淀粉品种为研究对象,对其加工性质、流变性质、凝胶质构特性、热力学
自由空间光通信(Free Space Optical Communication,FSOC)是一种以激光为载体,大气为信道的无线通信。尽管FSOC有成本较低,不需要铺设链路,传输速率快,节省空间等优点,但FSOC会受到大气环境的影响,降低通信质量。自适应光学(Adaptive Optics,AO)是一种可以实时捕获光束,监测由于大气湍流产生的波前像差,并通过算法对波前像差进行校正的技术。其中非波前
三维多通道交互是一种更贴近现实世界认知的交互方式,支持多种输入输出设备,能满足不同用户群体的交互需求,在医疗、教育等领域得到了广泛的应用。通过三维多通道用户界面,人们可以更加方便地执行操作任务和感知系统状态,在交互的过程中有更强的沉浸感和真实感。因此,研究以用户为中心的三维多通道界面设计具有重要的实际价值和意义。由此产生两个亟待解决的问题:三维多通道用户界面缺乏统一的界面范式,给界面开发带来了困难
高可靠低时延通信(ultra-reliable and low-latency communications,URLLC)是5G三大核心应用场景之一,主要用于承载工业自动化、自动驾驶、远程医疗等新型业务。URLLC要求传输时延在1ms以内的可靠性达到99.999%。支撑这种对时延Qo S(quality of service)及可靠性要求极其严苛的业务对MTC(machine type commu
石油天然气作为我国重要的能源在各行各业都起到不可或缺的作用。地震勘探是油气资源探查的有效手段,受到地震勘探采集环境和采集仪器的影响,采集到的地震勘探数据往往带有大量的随机噪声,这些随机噪声湮灭了有效信号,降低了地震勘探数据的质量。沙漠地区采集的地震勘探数据中随机噪声不同于其他采集地区的随机噪声,往往具有非高斯、非平稳、非线性,与有效信号弱相似的特性,这些特性给沙漠地震勘探数据的噪声压制带来了挑战。
近些年来随着物联网的发展,互联网中的移动设备数量爆炸性的增长。然而传统的供电方式(例如,线缆供电和电池供电)已然成为了制约无线通信发展的重要因素。无线信息与能量同传技术(Simultaneous Wireless Information and Power Transfer,SWIPT)在这种环境下快速发展,其发射端通过发射携带信息的射频信号来给接收端传输能量和信息。多入多出(multiple i
传感器、网络、定位等技术日益发展,各类定位设备被广泛应用,产生了大量的轨迹数据。这些数据反映了移动对象的活动特点,在城市规划、商业决策、交通监测等领域都具有很高的研究和应用价值。然而,轨迹数据的采集、传输、存储、处理等步骤都可能出错,为数据引入噪声,干扰后续的研究与应用,因此需要预先进行噪声清洗。现有轨迹噪声清洗方法在处理异常轨迹和配合领域知识上存在问题。一方面,异常轨迹常常被当成噪声一并加以检测
三维激光切割机是一种现代加工制造行业常用的板材加工设备,与传统切割设备相比具有无污染、加工效率高、操作便捷安全等优点,已被广泛用于塑料、玻璃、陶瓷、木材、半导体和皮革等材料加工中。尽管国内已有多种型号的三维激光切割机,但依旧存在占地面积大、生产成本高的问题,且设备的加工稳定性与国外先进激光切割机相比仍有一定差距。因此,在公司实习期间,依托苏州天弘激光股份有限公司的研发团队,设计制造了一种中小型三维