简答题自动评分方法研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:andykwok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动评分任务是给定学生答案,要求计算机依据参考答案预测对应分值。自动评分是智慧教育的一个研究热点,可以有效增加评分一致性。本文以中文简答题自动评分作为研究对象,对其进行分析与研究,主要工作如下:(1)基于注意力机制的自动评分策略。本文使用注意力机制刻画学生答案与参考答案的语义匹配情况,实现了自动评分模型Att-Grader。该模型首先通过长短期记忆网络对学生答案与参考答案进行序列编码;然后,利用互注意力机制进一步捕获二者的语义信息,最后通过卷积神经网络预测分值。中文数据集的实验结果表明:引入注意力机制的评分模型相较于基线模型在准确率评价指标上提高了1.9%-14.7%。(2)基于参考答案集构建的自动评分策略。针对参考答案不能完全覆盖多样性的学生答案的问题,本文提出构建参考答案集扩充原有参考答案的思想。具体为:首先对满分学生答案进行聚类;其次通过相似度计算得出每一簇的代表性答案;最后将代表性答案组合为参考答案集。将参考答案集与Att-Grader评分模型相结合,对学生答案进行分值预测,在中文数据集上进行实验,结果显示:融入参考答案集的Att-Grader评分模型在准确率评价指标上最大提升了3%。(3)基于数据增强的自动评分策略。本文尝试使用数据增强方法来克服训练数据集不足的问题。具体使用三种数据增强方法:基于关键词替换的数据增强、基于回译的数据增强、基于软增强的数据增强。在中文数据集上对三种数据增强方法进行测试,结果显示:基于软上下文的数据增强训练在Att-Grader模型上效果最好。本文对中文简答题自动评分进行了探索,主要贡献有:(1)尝试使用注意力机制刻画学生答案与参考答案之间的匹配程度,并构建自动评分模型Att-Grader;(2)构建参考答案集,缓解参考答案不能完全覆盖多样性的学生答案的问题;(3)将数据增强技术应用到自动评分任务,提高自动评分准确率。
其他文献
智慧农业包括生产和经营两个方面,生产方面包括机械化、自动化、智能化和信息化。新型职业农民是能够利用智慧农业技术进行生产、管理和经营的先进农民。智慧农业的发展需要
【正】 对表演我是个外行,说不出体会。我只能从一名观众的角度谈点感想。我觉得,我们所以重视反面人物问题,专门坐在这里探讨,首先是因为作为艺术形象的反面人物和社会生活
在规划设计过程中,用以表达基地原始信息、承载规划设计行为的操作界面,就是规划设计操作平台。随着数字化技术的进步,一种基于计算机辅助建造技术(CAM)和增强现实技术(AR)的
"合理差别"是指法律和政策可以对不同的主体进行分类,以便"合理差别"对待;而如果这种分类措施的目的是正当的,而且分类措施也是实现这一目的所必需的,那么这种分类就是合理的
目的 研究超声在儿童骨骼肌肉疾病中的应用.方法 选取2014年7月~2016年7月期间收治的36例骨骼肌肉疾病患儿作为研究对象, 并进行回顾性分析, 观察超声的应用效果.结果 根据超
目的分析乙型肝炎相关慢加急性肝衰竭(HBV-ACLF)患者的免疫状态及其与预后的相关性。方法选取2014年1月至2014年12月本院收治的72例HBV-ACFL患者为观察组(HBV-ACLF组),并按照
目的:检测Ras/Raf/P-C-Raf在子宫腺肌病在位内膜、异位病灶组织中的表达水平,以及阻断Ras表达后病灶细胞抑制率的变化,探讨Ras/Raf/P-C-Raf在子宫腺肌病中的发病机制。方法:
2017年习总书记提到:要坚持不断推进厕所革命,努力补齐这块影响群众生活品质的短板。本论文主要是针对我国乡村旅游地区公厕建设技术落后,无人管理,卫生条件差等问题,从公厕
李清照词中"酒"的意象出现频率很高,主要与诗酒文化的熏陶、当时环境的影响及个人的生活经历有关。李清照借酒表达对自然、生活的热爱,抒发对爱情的渴望与忧愁,慨叹国家和自