基于递归神经网络的篇章连贯性建模研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户：zhrwudi

【摘要】

：

衔接性和连贯性是句子构成篇章的两个最基本特性。一般而言,衔接性是连句成章的词汇和语法方面的手段,而连贯是采用这些手段所产生的结果。衔接性指语篇中表层结构上的粘着性

【作者】

：

杜舒静

【出处】

：

江西师范大学

【发表日期】

：

2004年期

【关键词】

：

篇章连贯性递归神经网络衔接性实体

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

衔接性和连贯性是句子构成篇章的两个最基本特性。一般而言,衔接性是连句成章的词汇和语法方面的手段,而连贯是采用这些手段所产生的结果。衔接性指语篇中表层结构上的粘着性,是语篇的有形网络;而连贯性指语篇中底层语义上的关联性,是语篇的无形网络。根据功能语言学家Halliday所述,一个连贯的语篇由语义上相关的相似成份连接起来。如果篇章缺乏这种相似成份,必将出现语篇衔接上的缺口,从而导致不连贯现象。篇章连贯性建模旨在对篇章中句子间的连贯性程度建立可计算模型,是自然语言处理的一个基础研究问题,其可以被广泛地应用在许多与自然语言处理相关的应用中,例如:情感分析、统计机器翻译、篇章生成和文本摘要等。早期的篇章连贯性模型主要采用特征工程方法,从文本中提取出表示语义的各种特征,例如:篇章中的实体信息,句法路径信息等,然后进行特征选择,并训练分类器;随着深度学习在语音和图像领域取得巨大成功后,有些学者开始利用神经网络方法构建英文篇章的连贯性模型。但是,目前基于深度学习的篇章连贯性模型没有和早期的基于实体信息的模型进行有效融合,以突显篇章中实体在充当篇章衔接性的重要作用;同时,现有模型主要基于英文篇章,对中文篇章的连贯性模型研究比较缺乏。基于此,本文的工作主要体现在以下两个方面:1)首先,本文提出基于时间递归神经网络篇章连贯性模型,同时将篇章中的实体进行了分布式表示,并有效地融合了篇章中句子间的实体信息,通过中文句子排序任务和机器翻译连贯性评估两个任务上的实验结果表明了该方法的有效性;2)其次,本文提出基于双向LSTM(Long Short Term Memory)的篇章连贯模型,抽取篇章中相邻句子的实体信息,将其分布式表示,然后将此信息通过多种简单且有效的向量操作方式融合至句子级的双向LSTM深度学习模型中。通过中文和英文句子排序任务和机器翻译连贯性评估两个任务上的实验结果表明了该方法的有效性;总体而言,本文基于深度学习技术,探索了篇章的实体衔接性对连贯性建模的重要作用,提出了相关问题的一些解决方法,并通过实验验证了方法的有效性,对今后的汉语篇章连贯性建模具有一定的借鉴作用。

其他文献

江门职业技术学院科研项目管理系统的研究与分析

目前,江门职业技术学院的科研项目管理还比较落后,还是沿用老式的项目管理系统,完全满足不了现在的科目项目管理需求,因此,开发一套适合江门职业技术学院的科研项目管理系统

学位

科研项目管理管理信息系统数据建模项目进度管理项目计划管理

大兴安岭地区森林火灾后生态系统恢复评价体系构建与应用

本文以2003年根河特大森林火灾的火烧迹地为研究区,运用数据调研、野外实测、室内化验以及数学模型对根河地区森林火灾后生态系统恢复进行评价指标体系构建和初步应用。1.通

学位

森林火灾恢复评价指标体系生态系统

论夯实新时代党的意识形态工作主导权

意识形态工作,说到底就是举什么旗、走什么路、坚持什么样的主义。对于无产阶级执政党而言,掌握意识形态工作的主导权,是把党、国家和民族的命运牢牢握在手中的密匙。在中国

期刊

中国特色社会主义新时代中国共产党意识形态斗争主导权

文士之辨:黄宾虹画论中的观念与世变——一个思想史的分析与探问

<正>一、"作家"与"士习":院体的变迁创设于五代的翰林图画院是中国绘画史上的重要分水岭,院体与文人的分野某种意义上也滥觞于此。[1]张郁乎先生提出,就士夫画与院体画（或画工

会议

我国台湾地区挑选参审员的基本程序

十八届四中全会对人民陪审员制度改革提出了新要求。2015年2月,最高人民法院发布《关于全面深化人民法院改革的意见——人民法院第四个五年改革纲要(2014-2018)》,对推动人民

期刊

合议庭嘉义县检察官法院管辖人民陪审员制度参审制度无因回避嘉义市我国台湾地区基本程序

纳他霉素在食品检测中的研究新进展

纳他霉素又称匹马菌素或游霉素,是一种由纳他链霉菌受控发酵生成的天然抗真菌化合物,属于多烯大环内酯类。纳他霉素依靠其内酯环结构与真菌细胞膜上的甾醇化合物作用,形成抗

期刊

纳他霉素食品检测新进展

论英语新闻在英语阅读教学中的应用

大学英语阅读对于学生来说是最重要的基础课程之一,然而这门课程的教学现状却并不令人满意。通过对于这门课程教学现状的分析,结合英语新闻自身的特点和优势,提出在英语阅读

期刊

阅读课程英语新闻必要性应用价值应用步骤

重组人粒细胞集落刺激因子的表达、纯化以及PEG修饰

重组人粒细胞集落刺激因子（rhG—CSF）经大肠杆菌温度诱导表达后，其表达产物以包涵体形式存在，包涵体经过变性、复性和分离纯化等步骤处理后得到纯化的rhG—CSF。在一定的实验条件

期刊

重组人粒细胞集落刺激因子表达纯化单甲氧基聚乙二醇生物学活性

浙江传统村落祠堂文化传承研究

祠堂文化作为一种乡土文化,植根于传统村落,研究祠堂祭祖礼仪、祖先崇拜等文化,引导并应用好,使其在继承与改革中综合创新,在传统和现代中融合进步,在构建和谐社会中发挥作用

期刊

传统村落祠堂文化研究

低苯丙氨酸饮食治疗新生儿苯丙酮酸尿症疗效观察

苯丙酮尿症(PKU)是典型的氨基酸代谢病之一,是第一个可以早期诊断、治疗,能很好地改变预后的先天性代谢病。PKU属于单基因隐性遗传病,本病因缺乏苯丙氨酸羟化酶(PAH),使患儿

期刊

低苯丙氨酸饮食治疗氨基酸代谢病PKU新生儿疾病筛查丙酮酸

基于递归神经网络的篇章连贯性建模研究

其他学术论文