大学英语四级写作自动评分中的隐式篇章关系相关性的评定

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:ysy8023zq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
合理的写作自动评分系统应包括语言质量评分和内容质量评分两个方面。区别于作文的语言质量评分,作文内容评分更复杂,需要以语篇为框架分析语块(单词、短语、小句)间的有机联系。大学英语四级写作的评分准则是以内容为主语言为辅的总体评分准则,即作文内容是衡量作文质量的主要标尺。而文本内容就是隐式篇章关系,这是本研究的选题依据之一。自动评分系统的构想如下:计算机计算出待评分作文与已评分作文在隐式篇章关系上的相关性,再参考已评分作文的评分数据,给待评分作文自动评分。判断隐式篇章关系的相关性在整个自动评分系统中处于核心地位,也是本研究的论点。研究隐式篇章关系有两大模型,分别是传统的向量空间模型和潜伏语义分析模型。前者视除停用词外的所有词项为特征向量,并以这些特征向量表征文本。该方法的弊端在于无法解决一词多义及多词同义问题;后者也是从语篇的最小组成成分词汇出发来分析隐式篇章关系,但它辅以语言哲学为视角来探究语言习得乃至知识习得中的相似性及概括性问题,即柏拉图的困惑:人类如何凭借有限的线索信息习得大量知识?本研究的理论依据是后者。潜伏语义分析理论认为,文本中的词汇不是孤立存在的,它们通过某种潜在的语义网络紧密相连。但不是所有的词汇都与该潜在的语义网络直接相关,即我们需要提取与该潜在的语义网络直接相关的特征词汇。特征词项抽取过程分为两步:粗略提取特征词项即文本的预处理,包括完成大小写折叠、去除停用词及词根归一化;调用数学处理软件matlab中的奇异值降解功能函数再次提取特征词项,具体做法分为以下几个步骤:首先构建一个粗提取的特征词项x文本矩阵;然后进行奇异值降解,该函数可将原始矩阵表征为三个小矩阵的乘积;再观察分解后的三个小矩阵的每列的数值,依据具体情况选择前k列数值;调用奇异值降解的反向函数,将三个列数缩减为k的小矩阵相乘重构为一个新矩阵。新矩阵屏蔽了大量噪声信息,保留了原始矩阵中的重要信息,实现了真正意义上地特征抽取。计算机即是以该方法模拟人类识别相似性和实现概括性。这也是本文的理论核心。本文首先以一个经典的精简案例展示了潜伏语义分析理论在评定隐式篇章关系相关性中的重要作用。其次,我们以湖北工业大学非英语专业的本科生四级写作文本作为数据,进行了深入的分析,得出结论:隐式篇章关系的相关系数与人工评分的数据结果的确存在一定的联系。
其他文献
随着网络技术的发展,“互联网+”给许多传统行业的发展带来了新的方向。为了把学生培养成适应时代发展的新型人才,现在高专院校都开设有计算机基础课程,其目的是让学生掌握基
Objective:To investigate the difference between constant infusion of dexmedetomidine and target-controlled infusion of remifentanil in the laparoscopic operatio
跨国公司与发展中东道主政府之间是一种动态的讨价还价关系,双方在合作的框架体系中博弈。跨国公司和东道主的利益分配能力取决于各自的讨价还价能力,而讨价还价能力随着双方
我国的建筑行业的发展随着时代以及经济的发展变得越来越好,而随着人们生活水平的提升,对于房屋建筑的安全性已经施工质量的关注程度也越来越高。在房屋建筑中,最为常见的问
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
Objective:To construct a recombinant lentiviral vector that co-express ZsGreen and BDNF and establish an Adipose derived stem cell (ADSC) line with stable BDNF
据统计,丰城市60周岁以上老年人口已达近20万,占人口总数的13.63%,是江西全省老龄化程度较高的地区,支持和推动社会养老服务业的发展成为当前政府的主要任务之一。
本文是一篇模拟交替传译笔记法的实践报告,根据奥巴马夫妇演讲进行模拟交替传译,旨在就吉尔“认知负荷模式”指导下笔记法在交替传译过程中有效合理的运用进行研究,以期提升
Objective:To study the value of serum pepsinogenⅠ andⅡ ratio (PGR) for evaluating the malignant biological behaviors in gastric cancer lesions.Methods:The pat
此翻译实践报告所用的翻译材料是社会科学文献出版社出版的《中国的中等收入转型》一书的第八章,该章节名为“拉丁美洲的教训:危机、汇率和不平等”,是本书最关键的章节之一,