汉语水平考试(HSK)作文自动评分研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:glosslee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,随着汉语学习者的人数逐年上升,与之相关的汉语水平等级考试(HSK)的需求也在不断增加。目前HSK考试的作文部分还是采用人工评分方式进行,该方式虽然效度良好,但也存在着效率低、成本高等问题。而自动作文评分技术则可以有效避免上述问题,并且该技术相比于人工评分,还具有中立性、客观性等诸多优点。本文的最终研究目的是实现可用的HSK作文自动评分系统。作文自动评分首先是一个多分类任务,在机器学习领域针对多分类任务的算法除线性回归外,还有支持向量机(SVM)、朴素贝叶斯等。随着深度学习技术的不断发展,人工神经网络技术在自然语言处理领域的应用也得到了惊人的表现,这对HSK自动作文评分的研究提供了较好的技术支持。以往的HSK作文评分研究大多停留在采用基于线性回归的方法去计算不同指标与作文分数的相关性上,虽然都取得了较大发现,但是线性回归方法相较于支持向量机、朴素贝叶斯、深度学习等技术在HSK作文数据集上的表现孰优孰劣,并没有相关研究。基于这样的研究空白和问题,本文首先收集了来自北京语言大学研发的“HSK动态作文语料库”数据集。其次,在该数据集的基础上,本文分别利用多元线性回归技术、支持向量机技术(SVM)和LSTM深度学习技术训练了三种模型。通过三种模型对比,以SVM与LSTM方法建立的评分模型都在某一特定作文分数档的数据集上有最佳的表现,而在其他档的数据集上表现则很差。以多元线性回归方法为基础建立的评分模型在中高分档的作文数据上表现最佳,在其他分档的数据上的macro-F1值主要集中于0.4至0.5区间。因此,本文得出结论,多元线性回归模型最适用于HSK作文自动评分任务。最后,本文进一步将基于多元线性回归的评分模型部署至Web端,将学界有关于此的理论技术性研究转变为实际可操作的应用。
其他文献
体育舞蹈是一种具有高度艺术性和竞技性的有氧运动项目,是由社交舞转化而来,是一种男女为伴的步行式双人舞,是使用规定的技术步法和艺术表现力展现出来的舞蹈表演。体育舞蹈引入我国已30余年,作为一项新兴的体育类项目,30余年来体育舞蹈通过其鲜明的感染力深受国人青睐,一路蓬勃发展并逐步形成了不小的影响力。本文以株洲市少儿体育舞蹈培训机构发展对策为主题,通过问卷调查法、文献资料法以及数据统计法、专家访谈法等研
纸塑复合袋具有复用性强、强度高、透气性好且抗氧化能力强等特点,被广泛应用于食品、药品和工业品的运输包装或销售包装。目前,纸塑复合袋的加工基本实现自动化,但其缺陷的检测仍需人工完成。纸塑复合袋在套袋和传输工位上会发生偏移,从而导致缝纫和印刷缺陷。随着国民经济对纸塑复合袋需求的增长,对其生产过程中的倾斜缺陷进行检测和矫正具有重大意义。本文主要完成以下工作:(1)分析纸塑复合袋成型工艺,指出纸塑复合袋生
近年研究发现,当组织发生炎症、缺血或缺氧损伤时,受损细胞和免疫细胞均会在短时间内释放出胞外核苷酸,如ATP、ADP、UTP和UDP;这些胞外核苷酸作为危险信号直接作用于细胞表面
目的:研究抑癌基因PTEN启动子区域在人甲状腺乳头状癌细胞株中的甲基化状态,以及去甲基化制剂5-氮杂-2’-脱氧脱苷(5-Aza-CdR)对其影响和作用,其表达水平是否受到甲基化调控,
随着2019年第一批5G商用牌照的发放,我国正式进入5G元年。虽然5G网络许多新兴技术例如毫米波、超密集组网等能有效缓解4G网络频谱效率低,传输速率慢等问题。但随着用户数量与接入设备的爆炸式增加,在通信资源受限的情况下,同时为如此多的用户提供服务仍然给运营商带来了严峻的挑战。此外,用户体验质量是5G时代一个重要的性能指标。通过提升用户体验质量能够高效提高用户满意程度,从而增加用户粘性。因此有必要在
《日本国宪法》因和平主义、立宪主义和民主主义而闻名于世。对许多日本人来说,宪法是神圣不可侵犯的,但也有一些人将其视作强加给战败国家的枷锁。安倍第二次执政期间,支持修宪的议员在国会占据多数席位,说明日本已经具有实现修宪的政治和舆论环境,但成功修宪仍有许多阻碍因素。安倍内阁推进修宪的困难不仅在于如何凝聚国内的共识,还在于如何让国际社会认可其修宪的理由。本文的核心问题是,中美学界对安倍修宪的认知是否以及
钠和氯是动物体内重要的电解质,对调节酸碱平衡、水盐代谢、维持机体渗透压、保证营养物质适宜的代谢环境等方面发挥着至关重要的作用。在家禽饲粮的配制上应对钠、氯适宜添加水平加以重视,但此类研究在鹅上还很少。本试验以玉米-豆粕型实用日粮为基础,选用多种钠盐、氯盐,旨在研究饲粮中不同钠、氯水平对1-28日龄和29-70日龄2个阶段仔鹅生长性能、耗水量以及饲料养分利用率等的影响,以期探明不同阶段仔鹅饲粮钠和氯
改革开放以来,我国各城市经济高速增长的背后是环境损害和生态破坏的持续积累和集中爆发。适逢中国经济增速换挡和转型升级的关键阶段,如何通过政府规制政策的制定和实施推动经济高质量发展和产业结构的优化升级至关重要。为有效控制酸雨和二氧化硫污染的问题,国务院于1998年正式批复实施《酸雨控制区和二氧化硫污染控制区划分方案》,方案明确了污染治理的长期目标,采取调整产业结构、推行清洁能源、淘汰落后生产工艺和设备
在现代战争中,空战是主导战争走向的关键因素之一,谁拥有了制空权谁就占据了战场优势。发展拥有智能决策系统的制空型无人机引起了各航空强国的广泛关注。在空战过程中,如何根据获知的战场信息,实时做出决策,实现快速、合理的引导占位,优先构成攻击条件实施武器打击是制空型无人机取得空战胜利的关键。本文面向无人机自主空战优化占位引导问题开展研究。首先,分析了专家系统和滚动时域等传统决策方法在解决无人机空战占位引导
随着煤矿开采深度的不断增加,综放工作面回采过程中大量遗煤存在于采空区中,致使综放工作面采空区成为煤自燃灾害的主要频发地点。准确判别与划分采空区复合灾害危险区域以及建立相应采空区复合灾害危险性评价体系对于复合灾害防治具有十分重要的意义。以阳煤一矿81303综放面采空区为研究背景,采用实验室实验、现场观测和数值模拟等研究方法,创建综放工作面采空区复合灾害危险性评价体系,并对81303综放面采空区复合灾