基于递归神经网络的篇章连贯性建模研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:zhrwudi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
衔接性和连贯性是句子构成篇章的两个最基本特性。一般而言,衔接性是连句成章的词汇和语法方面的手段,而连贯是采用这些手段所产生的结果。衔接性指语篇中表层结构上的粘着性,是语篇的有形网络;而连贯性指语篇中底层语义上的关联性,是语篇的无形网络。根据功能语言学家Halliday所述,一个连贯的语篇由语义上相关的相似成份连接起来。如果篇章缺乏这种相似成份,必将出现语篇衔接上的缺口,从而导致不连贯现象。篇章连贯性建模旨在对篇章中句子间的连贯性程度建立可计算模型,是自然语言处理的一个基础研究问题,其可以被广泛地应用在许多与自然语言处理相关的应用中,例如:情感分析、统计机器翻译、篇章生成和文本摘要等。早期的篇章连贯性模型主要采用特征工程方法,从文本中提取出表示语义的各种特征,例如:篇章中的实体信息,句法路径信息等,然后进行特征选择,并训练分类器;随着深度学习在语音和图像领域取得巨大成功后,有些学者开始利用神经网络方法构建英文篇章的连贯性模型。但是,目前基于深度学习的篇章连贯性模型没有和早期的基于实体信息的模型进行有效融合,以突显篇章中实体在充当篇章衔接性的重要作用;同时,现有模型主要基于英文篇章,对中文篇章的连贯性模型研究比较缺乏。基于此,本文的工作主要体现在以下两个方面:1)首先,本文提出基于时间递归神经网络篇章连贯性模型,同时将篇章中的实体进行了分布式表示,并有效地融合了篇章中句子间的实体信息,通过中文句子排序任务和机器翻译连贯性评估两个任务上的实验结果表明了该方法的有效性;2)其次,本文提出基于双向LSTM(Long Short Term Memory)的篇章连贯模型,抽取篇章中相邻句子的实体信息,将其分布式表示,然后将此信息通过多种简单且有效的向量操作方式融合至句子级的双向LSTM深度学习模型中。通过中文和英文句子排序任务和机器翻译连贯性评估两个任务上的实验结果表明了该方法的有效性;总体而言,本文基于深度学习技术,探索了篇章的实体衔接性对连贯性建模的重要作用,提出了相关问题的一些解决方法,并通过实验验证了方法的有效性,对今后的汉语篇章连贯性建模具有一定的借鉴作用。
其他文献
目前,江门职业技术学院的科研项目管理还比较落后,还是沿用老式的项目管理系统,完全满足不了现在的科目项目管理需求,因此,开发一套适合江门职业技术学院的科研项目管理系统
本文以2003年根河特大森林火灾的火烧迹地为研究区,运用数据调研、野外实测、室内化验以及数学模型对根河地区森林火灾后生态系统恢复进行评价指标体系构建和初步应用。1.通
意识形态工作,说到底就是举什么旗、走什么路、坚持什么样的主义。对于无产阶级执政党而言,掌握意识形态工作的主导权,是把党、国家和民族的命运牢牢握在手中的密匙。在中国
<正>一、"作家"与"士习":院体的变迁创设于五代的翰林图画院是中国绘画史上的重要分水岭,院体与文人的分野某种意义上也滥觞于此。[1]张郁乎先生提出,就士夫画与院体画(或画工
会议
十八届四中全会对人民陪审员制度改革提出了新要求。2015年2月,最高人民法院发布《关于全面深化人民法院改革的意见——人民法院第四个五年改革纲要(2014-2018)》,对推动人民
纳他霉素又称匹马菌素或游霉素,是一种由纳他链霉菌受控发酵生成的天然抗真菌化合物,属于多烯大环内酯类。纳他霉素依靠其内酯环结构与真菌细胞膜上的甾醇化合物作用,形成抗
大学英语阅读对于学生来说是最重要的基础课程之一,然而这门课程的教学现状却并不令人满意。通过对于这门课程教学现状的分析,结合英语新闻自身的特点和优势,提出在英语阅读
重组人粒细胞集落刺激因子(rhG—CSF)经大肠杆菌温度诱导表达后,其表达产物以包涵体形式存在,包涵体经过变性、复性和分离纯化等步骤处理后得到纯化的rhG—CSF。在一定的实验条件
祠堂文化作为一种乡土文化,植根于传统村落,研究祠堂祭祖礼仪、祖先崇拜等文化,引导并应用好,使其在继承与改革中综合创新,在传统和现代中融合进步,在构建和谐社会中发挥作用
苯丙酮尿症(PKU)是典型的氨基酸代谢病之一,是第一个可以早期诊断、治疗,能很好地改变预后的先天性代谢病。PKU属于单基因隐性遗传病,本病因缺乏苯丙氨酸羟化酶(PAH),使患儿