基于迁移学习的基础教育地理领域概念关系抽取

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户:tujiangbo110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以基础教育地理学科为研究对象,针对地理领域的概念关系抽取进行研究。但是,地理领域目前没有充足的语料支撑概念关系抽取研究。传统的解决方法是人工扩充语料库,但其人力成本高,而迁移学习方法能够迁移源领域的知识帮助目标领域解决仅有少量数据的问题,故本文研究如何基于迁移学习解决地理语料不充足的问题,以提升地理概念关系抽取的准确率。论文的主要研究工作如下:1)针对基础教育地理文本的时序性特征,利用长短期记忆(Long Short-term Memory,LSTM)神经网络,构建了基于词特征和句子特征的概念关系抽取模型。本文将地理概念关系抽取定义为基于给定概念对的关系语句分类问题,词特征是概念对的基本特征,使用Word Embedding进行提取;句子特征能够完整表达语句序列的语义信息,而LSTM因能有效利用序列数据中长距离的依赖信息,被认为适合处理文本序列数据,故使用LSTM提取概念对所在句子的句子特征。在地理概念关系语料不充足的情况下,该方法的准确率较低。2)针对地理概念关系语料缺乏的问题,提出了基于LSTM的迁移学习方法,该方法将开放领域的知识迁移到地理领域,辅助地理领域更准确地完成概念关系抽取。该方法由两部分组成:Sogou词向量经由大量数据训练得到,其特征表示比使用少量地理文本训练得到的词向量更准确,故首先提出了基于Word Embedding的词向量迁移学习方法,将Sogou词向量迁移到地理领域,进行对比实验。由于迁移后词向量的特征空间不一致,导致该方法对准确率的提升不明显。因而,进一步提出了基于网络权重的迁移学习方法,该方法先将使用开放域文本训练得到的LSTM网络权重按层迁移到地理领域;然后地理领域针对迁移的网络权重做了两种处理:保持不变和重训练调整,进行对比实验。实验结果表明,若使用地理文本对迁移的网络权重进行重训练调整,能较显著提升地理概念关系抽取的准确率。但该方法没有解决知识迁移过程中,因数据分布不一致产生的领域适应性(Domain Adaptation)问题。3)为了解决开放领域向地理领域进行知识迁移过程中产生的领域适应性问题,构建了基于多潜在特征空间层的地理领域迁移学习模型。该模型首先利用开放领域和地理领域间的相同概念建立一个共享的潜在空间;然后利用两个领域的特有概念,分别建立三个特有的潜在空间,并将三个特有空间和共享空间组成三个潜在特征空间层,同时用于学习两个领域间的数据分布。此外,该模型采用非负矩阵三因子分解(Nonnegative Matrix Tri-Factorization,NMTF)技术解决模型优化问题。该方法能初步解决两个领域间的领域适应性问题。
其他文献
<正>品牌优势燕赵都市报是蜚声业内的社会生活类报纸,自1996年创刊以来,始终坚待新闻立报、内容为王的豢旨,凭借"民生立报"的指导思想,在燕赵大地树立了良好的美誉度,连续十
3月25日-27日,第十六届中国国际地面材料及铺装技术展览会(DomotexAsia2014)在上海新国际博览中心举行.特吕茨勒非织造和人造纤维板块在W3号馆的D10展位进行展示。参观者可以在此
<正>2006年11月15日,中国人民银行再次上调存款类金融机构人民币存款准备金率0.5个百分点。人行说明,今年以来,人民银行综合运用多种货币政策工具,大力回收银行体系流动性,流
西周龙纹是青铜器的主要纹饰之一,根据样式不同可以将其分为爬行龙纹、蟠龙纹、团龙纹、两头龙纹、交体龙纹、双体龙纹等类型。再根据龙纹形制可以总结出龙纹具有对称性、连续
<正>探索集体土地股份制改革,使农民对集体资产享有充分的股权,实现农民收入的持续性和永久性。这是城镇化健康推进的需要,更是农村乃至国家长治久安的需要。本期会客厅邀请
利用大涡模拟(LES)方法对阀体后90°圆形弯管内部流场进行了三维数值模拟,获得了蝶阀在全开状态下弯管内不同截面的流场特性和不同径向截面的涡旋结构,并与粒子图像测试(PIV)
早在2005年11月,昆明市就出台了与垃圾分类有关的城市垃圾管理办法,但10多年来,昆明垃圾分类成效仍待提升,街头和居民生活区的分类垃圾桶中至今仍是“大杂烩”。垃圾分类之所以难
报纸
兰州市是西北干旱地区典型的河谷盆地型城市 .分析了兰州市独特的自然条件对城市土地利用空间结构产生的巨大影响以及市域、市区的土地利用空间结构模式和特征 ,最后阐述了河
<正>威海市辖荣成市、文登市、乳山市、环翠区以及高技术产业开发区、经济技术开发区、工业新区,全市陆地总面积5797平方公里,海岸线长达985.9公里,常住人口282万人,城市化率
卤系阻燃剂对生态环境和人体健康有较大的危害,因此绿色环保的无卤阻燃剂得到了较为快速的发展。无卤阻燃剂主要包括无机阻燃剂、有机硅阻燃剂和无卤膨胀型阻燃剂等。用于聚