基于专家知识的可解释作文评级方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:qq279301979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语文教育中,作文能力是评价学生语言水平的重要指标。自动作文评分不仅能够在考试测评领域对人工评阅的客观性和公正性提供技术支撑,而且能够辅助提升个人作文能力,具有重要的理论价值和应用价值。自动作文评分仍面临许多挑战。首先,虽然不同专家根据要求能够对作文评判一致,但是目前仍缺乏可量化的作文评分规则。其次,语言作为一种符号化体系,具有更高的灵活性,自然语言的处理相较于结构化数据的处理更为困难,过程缺乏可解释性。最后,考虑到语料库的标注问题,现存的大部分作文评分工作专注于对作文给出一个整体得分,缺少对作文细粒度评分的标注。词汇是作文的基础组成部分和重要评分依据,从词汇角度量化作文水平并融入到模型中是十分有必要的。针对上述问题,本文从词汇语用方面入手,提出了基于专家知识的可解释作文评级方法。本文贡献如下:(1)提出了基于专家评阅规范的中文作文词汇可量化评估框架,对语料库作文词汇水平进行标注。为了从词汇这一角度提升模型的可解释性,本文研究了高考作文评分标准和多个分等级词汇库,分析了初等教育小学和中学作文语料库,形成了基于专家知识和统计分析的分级词汇表。在此基础上,分析了在语言认知过程中作文词汇水平的变化,提出了可计算性作文词汇水平评价规则,并使用该评价规则对语料库中作文每条句子的词汇水平进行标注。(2)研究了基于深度神经网络的可解释作文评级方法。为了挖掘作文词汇、句子之间语义关系,对作文文本进行建模,采用基于词向量的双向长短时记忆网络模型,用于生成作文表示向量并给出作文评级。本文分别在模型的词汇和句子层面融入注意力机制,提取出作文中的高分句子,提出了一种可解释方法,从作文词汇水平方面解释了模型。同时,针对无意义高级词汇堆砌样本,为了增加模型的鲁棒性,本文分别从模型和数据两个方面对鲁棒性进行了分析,增加了对句法通顺度的检测。(3)在真实作文语料库上验证了模型性能。针对中小学作文语料库,验证了模型在作文评级任务上的性能,与其他相关工作相比,本文模型与人工评阅结果的一致性更高,并且具有更高的可解释性。针对特定考试,本文对模型进行调整,适配于某省成人高考作文考试中,实验证明模型可以在特定考试中给出较准确的作文评分。
其他文献
供水管道系统是社会存在与发展至关重要的基础设施,而管道泄漏一直是我国面临的严峻问题,因此,检测管道泄漏并对漏点定位具有重要的实际应用意义。供水管道泄漏检测方法很多,
近年来,太阳能光伏发电发展迅速,但同时存在着诸多问题和挑战。如:串联配置的光伏电池串以及光伏组件在阴影或其它失配条件下会损失很多功率,严重时会产生热斑。开关电容均衡
随着我国社会和经济的发展,人们生活水平日益提高,对于饮食的需求已从“吃饱”向“吃好”转变。红米营养价值高,不仅含有丰富的硒、铁、锌、蛋白质、维生素、氨基酸等营养物
研究目的通过筛选化疗药物导致大鼠神经病理性疼痛(简称化疗痛)的特异性蛋白,并讨论分析化疗痛的分子机理,为开发特异性治疗化疗痛的新靶点奠定理论基础。研究方法选用SD雄性
目的:本研究目的是通过分析比较间变性淋巴瘤激酶(ALK)基因重排与表皮生长因子(EGFR)基因突变肺癌人群的临床因素及影像学特征。材料与方法:回顾性分析153例初诊的非小细胞肺
纤维编织网增强砂浆(TRM)复合材料是一种新型结构加固材料。与常用的纤维增强复合材料(FRP)相比,TRM具有更优异的耐候性和耐火性能。TRM中常采用聚合物水泥砂浆作为纤维编织
本文主要研究具有非线性阻尼项的高阶Kirchhoff方程的初边值问题解的长时间性态:(?)其中??R~n,??表示?的边界,ν是外法向量,m>1是一个正整数,q>0是一个正常数,这里?是Laplace
普通硅酸盐水泥的生存过程会产生大量的CO2排放到空气中,对环境造成很大的负担,而地聚合物混凝土是由工业废料-粉煤灰、矿渣和碱激发剂制成,是绿色环保材料,可部分或完全替代
目的乳腺癌是世界上最常见的恶性肿瘤之一,严重威胁着女性的身体健康。三阴性乳腺癌(triple-negative breast cancer,TNBC)是一种高度侵袭性的乳腺癌亚型,因为缺乏有效的治疗
混合型超级电容器将电池型电极和电容型电极用作器件的两个电极,结合了电池和超级电容器两种储能器件的优点,有望实现兼具高比能量和高比功率的电荷储存性能,因而在电动车、