论文部分内容阅读
随着国内越来越多的高中生参加美国大学入学考试(SAT),作文写作作为SAT考试的重要组成部分,对考试成绩的高低有重要影响。然而对国内英语非母语的高中生来说,英语写作始终是一个薄弱环节,急切需要提高。在传统的英语教学写作中,由于教师对作文的批改时间长、反馈不及时且反馈效果不明显、批改过程中容易受到人为因素影响等弊病,导致学生的写作训练效果远远达不到考试要求。英语作文自动评分系统是利用计算机和自然语言处理技术进行作文写作自动评分的工具,并且在评分之后对学生作文评阅信息可视化呈现,针对性地帮助学生优化写作技能,这样很大程度上可以有效地克服上述弊端,使得师生都受益,提高英语写作的水平。目前在国外已经有比较成熟的评分系统,并且实际应用中性能良好,但是这些系统都是针对英语为母语的学习者设计开发的,对国内英语非母语的学生并不太适合,所以对于国内的英语学习者,系统在评分策略上应有所改变,在反馈上有所改进。本论文是以测测SAT在线学习平台为依托,针对国内考生参加SAT考试的写作特点,探索能够有效地反映作文质量的特征项,并在此基础上建立合理的评分模型。本论文基于自然语言处理技术和统计回归分析技术对平台中的学生作文进行特征分析和提取,利用特征维度和评分分析模型预测作文的得分,在评阅过程中进行错误检测,并将评阅结果可视化展示。课题从572篇学生作文中提取词汇、搭配、语法、段落篇章等方面的特征项,主要对5个评分模块(词汇使用、语法、语义、主题论点和篇章结构)中影响词汇模块得分的特征项进行相关性研究分析,提取出显著相关的特征项,在下一步的研究中对其他评分模块进行特征项提取分析。并且对作文的评阅结果的可视化展示进行研究,将作文中出现的不同类别的错误分类展示,有针对性地提醒学生在作文中出现的错误。最后对评阅信息可视化呈现对教学的积极影响和可能存在的问题做了简要分析,并且总结了本文的优缺点,展望了今后的研究目标和方向。