面向图结构数据的文本生成技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jianghai9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,人们接触到的数据类型变得越来越多种多样,不仅有常见的纯文字数据,还有许多结构化的、半结构化的数据被收集保留了下来。这些新兴的结构化数据如商品库、社交网络、知识图谱等都可以用图结构来表示。因此,对图结构数据进行研究能够帮助我们更好地理解与运用图结构数据中包含的大量知识。本文主要研究课题为面向图结构数据的文本生成研究。分别从三个方面进行了研究,提出了融合图背景知识的文本生成模型、基于动态内容规划的文本生成模型,补充更新了数据集进行了数据增强,构建了基于图结构数据的科学文献摘要助手。本文根据数据集中图结构数据的边稀疏性的问题,从丰富结点特征表示的角度出发,在整个数据集上构建了背景图,使用多种图嵌入方法学习结点的背景知识,同时探索了多种表示融合的方法,将结点的背景知识与常见的文本生成模型进行融合。在AGENDA数据集上的实验表明,本文提出的融合图背景知识的文本生成模型取得了很好的效果。另一方面,本文根据目标文本与输入结点之间含有的对应关系这一特点,从优化文本规划策略的角度出发,提出了动态内容规划的策略,引入了内容选择层增强对输入关键词的感知,同时引入了基于词袋的句子级规划任务来监督输出句子的潜在语义表示。在AGENDA数据集上的实验结果说明了动态内容规划策略的有效性。在数据方面,本文使用与构建AGENDA数据集相同的方法sci IE算法,对爬取论文的摘要部分进行了实体识别和关系抽取,进行了数据增强,进一步提升了模型性能。在应用方面,本文搭建了基于图结构数据的科学文献摘要助手,根据用户输入的关键词作为结点,选择关键词之间的关系作为边信息,展示根据用户输入信息构建的图结构数据,并返回模型生成的摘要。模型被部署到服务器上,可供使用。
其他文献
研究区G油田位于大庆长垣构造的南部,目前已经进入开发中后期,油田内部的加密调整以及油田边部地区的有效开发成为了老油田增产上储的重要途径。解决这一问题,一是要进一步落实全区储层的发育与展布,另外就是要明确边部地区的构造和油水分布,从而进行外扩有利区的优选,为边部地区的合理开发提供依据。针对上述问题,本文基于构造地质学、层序地层学、沉积学和地球物理学理论,开展精细的井震标定,采用地震剖面与三维可视化相
学位
<正> 发热,中医有外感与内伤之分。外感发热常由六淫、疫疠、温毒等外邪所引发、为了系统观察外感发热的辨证论治疗效,探讨外感发热“证”的规律。我们在省中医内科专业委员会的领导下,成立了福建省中医治疗发热协作研究组。通过讨论,统一了诊断、辨证、治疗和疗效等标准。现将17个协作单位(1)共治疗600例,初步总结如下: 临床资料 (一)资料来源:系各协作单位,自1983年11月至1985年6月,在门诊,病
期刊
准噶尔盆地南缘作为典型的陆相多旋回叠合盆地,其内部发育成排成带的构造带和多套成藏储盖组合,油气资源量巨大。早期油气勘探主要以浅层古近系和新近系为主要目的层,而2019年高探1井的油气发现揭示准南深层下组合优越的油气勘探潜力。但目前有关下组合深层储层勘探程度较低,并缺乏针对性系统研究,使得深层下组合原型盆地演化特征及下组合优质储层成因机理及有利区不明,严重制约了后期油气勘探。据此,本次研究通过收集钻
学位
目的:对高分辨率食管测压在胃食管反流病中的应用效果进行探究和分析。方法:选取本院2019年6月至2021年6月收治的50例胃食管反流病患者为观察组,选取同期50例健康人员作为对照组。两组均接受高分辨率食管测压检测,比较两组患者相关指标。结果:观察组患者存在食管动力障碍;观察组患者高分辨率食管测压参数低于对照组,组间比较,差异具有统计学意义(P<0.05)。结论:高分辨率食管测压可以更为清晰地显示患
期刊
<正> 急性发热是内科急症之一。笔者二年来在住院病人中以辨证论治指导运用中医药治疗本病24例,取得满意效果,举例报道如下:一、长夏受邪,冬发伏暑傅××男52岁84年1月23日入院住院号5013。去年10月赴蜀,月余返京,此后常觉倦怠身重。七天前突作寒热,体温高达39.8℃,入院后患者诉述头痛头晕,身热恶寒无汗,咽干,纳呆,胸闷便溏,舌尖红苔白腻罩黄,脉浮滑数。查体温39.3℃,咽红,心肺(一)。白
期刊
<正> “心烦”非独特之病名,乃疾病演变过程中出现的一个症状。由于病变各异,因而表现有别。有在表在里之分,有属寒属热之辨;有为虚为实之异,有在腑在脏之殊。尽管其表现不一,而治病必求于本。伏其所主,先其所因,辨证求因,审因论治,定能收到事半功倍之效。笔者根据临床实践,列“心烦”证治十辨,以就正于同道。
期刊
乾130区块为近年回归的合作区块,位于松原市乾安县东南方向。构造处于乾安构造南翼,呈现中间高,两边低的构造格局,发育北-北西方向正断层。论文以乾130区块青山口组三段Ⅻ砂组为主要研究对象,该区块未系统开展过精细油藏描述工作,数字化资源建设落后,主力层位地层精细划分与对比、构造、沉积微相等静态地质研究欠缺。针对上述问题,本文在高分辨率层序地层学理论指导下,采用“旋回对比、分级控制、不同相带区别对待”
学位
A285区块萨尔图油层和葡萄花油层作为油田开发的重点,研究区萨葡油层岩性以砂泥岩为主,储层含泥含钙较重、孔隙结构复杂,存在低阻油层和高阻水层,这增加了储层流体性质评价与产能预测的难度。因此,对研究区开展流体性质评价与产能预测方法研究具有十分重要的意义。本文基于钻井取心、岩心分析、试油投产和测井等资料,开展A285区块萨尔图油层和葡萄花油层的储层特征及“四性”关系研究,得出萨尔图油层主要岩性为粉砂岩
学位
高动态范围(High Dynamic Range,HDR)是一种提高显示信号质量的技术。它与原有的标准动态范围(Standard Dynamic Range,SDR)形成对比,改变了视频和图像的亮度和颜色在信号中的表示方式,并允许更明亮的高光、更暗的阴影、更精细的细节以及更广泛更强烈的色彩表现。新兴的现代显示器能够呈现具有高动态范围和广色域(Wide Color Gamut,WCG)的超高清媒体内
学位
低真空管道磁悬浮运输系统是填补现有地面运输工具与民航客机之间运输速度空缺的重要方式,已经成为轨道交通行业研究的热点。结合低真空超高速磁悬浮系统管道环境需求,研究提出了沿管道布置真空泵组并配置监测、控制系统的低真空环境实现与维持技术方案,要求满足紧急情况乘客安全疏散的管道最低气压值不得低于50.7 kPa,推荐采用开启复压用挡板阀的方式实现快速破空。针对低真空环境对流换热效率低、超长距离管道检漏定位
期刊