【摘 要】
:
实现自然语言理解,甚至是语言生成,一直都是语言学界、计算机界的终极目标之一。不管是计算语言学,或者是自然语言处理(NLP),都是一直在探索语言的内部编码问题,并尝试解码。
论文部分内容阅读
实现自然语言理解,甚至是语言生成,一直都是语言学界、计算机界的终极目标之一。不管是计算语言学,或者是自然语言处理(NLP),都是一直在探索语言的内部编码问题,并尝试解码。问句分类作为自然语言理解或者是自然语言生成的一个重要环节,其分类的体系方法影响着整个问句分析模块,同时间句分类的准确率高低会直接影响到语言理解的后续模块。从这个立足点出发,本文将多层次的问句分类结构体系与卷积神经网络模型相结合,结合具体的实验数据对多层次问句分类体系的合理性以及影响分类准确率的一些因素进行详细的分析与论证。第一章主要为绪论,首先介绍了一下问答系统的模块构成,以及问句分类在其中所属的位置:其次叙述了本文的研究背景,即问答系统以及问句分类各自的国内外研究现状;然后从三个角度阐述了一下本文的研究意义;最后是本文的组织结构。第二章主要分为三个部分。第一个部分主要是选取语料的过程,包括语料的选择标准和选择方法;第二个部分是对疑问句进行层次分析,从传统语言学的角度给疑问句进行分类,并建立多层分类体系——M-QCS;第三部分是对语料进行预处理,包括去停用词、分词、词向量转换等。第三章主要分为三部分。第一部分先介绍卷积神经网络(CNN)的一些理论背景,包括深度学习(Deep Learning)的发展以及CNN的基本理论;第二部分主要是介绍一下CNN的基础架构,包括卷积层、激活函数、池化层等关键技术部分;第三部分是建构自己的CNN模型,大致描述分层设计思路。第四章主要分为两大部分。第一部分主要分为三个方面,一是介绍一下人工选取语料集的标准,包括不同类型的问句构式;二是展示一下Word2vec的训练模型,还有简要叙述一下具体的CNN模型原理;三就是此次实验的一些具体过程,包括一些参数设定以及部分伪代码。第二部分就是实验结果的数据统计以及对于实验结果进行的分析,首先是通过实验结果验证了多层分类体系的合理性,并分析了分类错误的原因。其次通过词频统计对于数据结果进行分析,得出了高频词频率之和的大小与分类准确率高低有着正相关的关系,同时也对分类错误的原因进行了分析说明。第五章大致就是对于本文观点的一些概述,梳理全文脉络,进一步对于本文的结论进行简要总结。其中包括对于本文不足之处的一些看法,主要是从语言学角度和计算机角度去说明;其次就是对于本文涉及到的一些次要的语言学问题进行梳理,为以后的问句分类研究提供了一些思路和方向。
其他文献
目的自发性蛛网膜下腔出血(SAH)多数是由于颅内动脉瘤破裂而引起的,准确诊断、详细评价颅内动脉瘤病理解剖对临床治疗有重要的意义。通常二维数字减影血管造影(2D-DSA)只能提
<正>如今更多的人们会选择去电影院看电影,一方面是因为电影院的银幕更大,视觉效果更好,而另一个更重要的方面是因为去电影院观影可以达到一种听觉的享受,立体声的效果,震撼
[目的 /意义]面对高校信息呈现碎片化的趋势,提出高校信息碎片化整合流程,并应用随机森林算法构建高校信息碎片化整合的特征选择模型。[方法 /过程]基于高校信息整合的发展现
声学人工材料由于其在消声降噪,全息声学,粒子操控及国防军事等领域具有重要的应用,已成为声学领域的研究热点。设计具有特殊结构的声学人工材料可以实现各种新奇的声学效应,如:负折射、自弯曲束、螺旋束、无衍射束、漫反射及声聚焦等。与传统声学材料相比,声学人工结构具有小尺寸,调控灵活及智能化等优点,具有广泛的应用前景。本论文基于声学人工结构设计实现了多种新型声学器件。除第一章绪论和第八章总结和展望之外,主要
目的:糖尿病已成为严重威胁人类健康的慢性疾病之一。胰岛素抵抗是2型糖尿病的主要特征,而骨骼肌中的胰岛素抵抗已成为许多研究和评论的焦点。孤儿核受体Nur77是核受体超家族
实际工程中,氯离子引起的钢筋锈蚀是多种破坏因素共同作用的结果,其它因素为氯离子的传输和侵蚀创造了有利条件,从而加速钢筋混凝土结构的劣化和失效。本文概述了应力、冻融
中国共产党的工作作风建设直接关系到党的形象、党的执政地位和社会主义事业的兴衰成败。十八大以来,由于世情、国情及党情的深刻变化,我党在工作作风中出现了一些问题,一定
[目的]通过对脑白质病变(cerebral white matter lesions,WML)患者进行多导睡眠图(polysomnography, PSG)监测、血清Aβ1-40总量测定、蒙特利尔认知评估量表(Montreal Cognit
目前,食物短缺、环境污染及能源危机等全球性问题日益突出,因此探索合理有效的开发与利用可再生资源的有效途径显得日趋重要。木质素结构复杂,难以降解,给纤维素资源化开发和
互联网及相关技术已应用于人们生活的方方面面,随着移动互联网如3G、4G等技术的兴起,手机已经成为人们访问互联网的主要媒介,VoIP技术也逐渐开始流行。相比于传统电话,VoIP通信方式有着费用低、部署简单、可定制性强等优点。但是,由于VoIP通信质量依赖于网络质量,而无线网络质量相比于传统移动电话难以得到保证,因此在VoIP音频、视频通信中有着回声、噪声、卡顿等各方面干扰因素。若要使VoIP技术有着