自动作文评分模型及方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:uestchujun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
写作作为语言考试的一种必备题型,通常需要大规模的作文阅卷,采用人工评分的方法一方面浪费大量的人力、物力,另一方面,人工评分依赖阅卷老师的主观判断,存在一定误差。随着自然语言处理技术的发展,其在句法分析,语义分析、情感分析等方面取得了突破性的进展,利用自然语言处理技术对作文进行自动评分具有重要的意义。传统的自动作文评分方法主要对整篇文章进行统计,提取词法、句法、语义等特征,代入机器学习模型中进行训练,从而预测评分,这种方法通常依赖于人工提取的规则特征,并且只简单的考虑篇章整体质量,没有很好的考虑到其中更细节的信息,比如篇章的上下文信息等。基于这些问题,本文在传统评分方法上,进一步抽取句子层面的特征,并利用篇章的上下文的时序信息,挖掘作文潜在的逻辑性、连贯性对评分模型的影响。另外,针对语言考试中规定题目的写作情景,从考察作文是否符合题意角度出发,研究了作文主题相关度在评分模型中的效果。本文的研究内容主要包括以下三个方面:(1)研究了句表示方法和深度学习模型在自动作文评分中的应用。在写作这个特定情境下,作文更适合看作具备逻辑性的语句序列,为了挖掘句子之间隐藏的逻辑信息,本文主要使用无监督的方法表示句向量,其中包括Doc2Vec技术、递归自编码器等。然后使用深度学习方法构建模型,本文主要基于CNN模型在提取特征上的优势和LSTM模型适合时序性问题的特点,设计并实现了多种模型结构,找到适合该问题的建模方法。并与传统评分模型进行融合,使评分模型效果得到提升。(2)研究了说明文体裁作文的主题相关度在评分问题中的作用。主要通过提取题目文本与作文文本之间的相似度特征,并引入基于主题的语义离散度的概念,分析其对最终评分结果的影响。(3)设计并实现了一个作文自动评分系统。该系统能够对作文质量给出及时的评分反馈,并且在词法、句法、逻辑、主题角度给出相关的反馈。并增加了纠错模块,可以一定程度上提供给用户更好的写作反馈体验。
其他文献
通过对出让国有建设用地使用权改变用途等土地使用条件如何处理的法律法规政策规定的分析,结合工作实际,提出了如何处置的具体方式。
通过对预审制度落实现状的分析,指出存在的主要问题,并从提高对预审制度的重要性认识、合理确定预审的项目类型、发挥预审引导作用及充分实现预审法律效力四个方面进行了思考
河道淤泥气泡混合土(FMLSS)是一种具有轻质、高强度及良好流动性的新型工程材料,工程应用广泛。基于此,利用包括密度、强度与固结等物理力学试验方法,考察了FMLSS在不同水泥掺
大气扰动误差是地基合成孔径雷达(GBSAR)观测的主要误差之一,它与大气环境的变化密切相关,受大气扰动干挠影响随时间和空间的变化而发生改变。通过分析大气扰动误差在时间和空间上的变化特性,采用二次曲面函数建立大气扰动的分布模型,利用多个固定点解算模型参数,进而估算整个测区任意位置的大气扰动误差。试验结果表明,该方法有效改正了大气扰动误差,提高了GBSAR观测结果的精度。
在语文本色回归中对学生人文素养进行培养是一项值得重视的教学目的,教师只有坚持语文的本色回归,从课堂情景中优化设计,使学生能够有兴趣参与其中,在基础知识的学习上增加人
贾卡技术是目前经编领域最新最高端的技术之一,具有很大的发展潜力和前景。文章首先介绍了贾卡系统历年来的发展历程;随后阐述了目前在成圈型贾卡领域最为先进的3项技术:单贾