基于文本挖掘的主观题评阅辅助系统的研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:mjc198603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机评阅客观题已基本实现,对于主观题,由于它的答题特点和复杂性,目前还没有一种考试系统能很好地完成其自动评阅。随着数据挖掘、模式识别、人工智能及自然语言理解等方面的不断发展,利用计算机评阅主观题将逐渐成为事实。   在教师评阅主观题时,一般要检查学生答案中的得分点,即关键字,关键字越多,分数越高;其次要看关键字和标准答案的相似度,相似度越高,则分数越高。本文主要通过文本挖掘中的文本分类算法将主观题答案分到某一分值的类别中,主观题的最后得分也就是所属类别的分值。   文章首先研究了主观题文本的预处理,如分词算法、向量空间模型、特征选择等基本理论及两种文本分类算法:最近邻法及BP神经网络法,并对各种算法进行分析;其次建立了基于某一学科且能动态调节的专业词库,并提出了将正向最大匹配法与专业词库相结合对文本进行分词的方法,解决了分词技术中歧义切分及未登录词问题;另外又提出了匹配替换法,对分词结果进行优化,解决了分词结果中词单位小、数量多的不足,并使关键字的集合更加接近于学生答案;再就是通过计算关键字的文档频率,对关键字进行特征选择,选取给定数目的关键字,通过向量空间模型将一个文本表示为向量空间中的一个特征向量;最后利用kNN和BP神经网络法将预处理得到的学生答案分类,分别对主观题文本进行测试,并对这两种分类算法的准确性及有效性进行分析。选取一种准确性较好的分类算法建立主观题评阅辅助系统。   本文立足于中文自动分词和主观题文本分类两方面的问题,用Matlab进行仿真实验,并通过Visual C++进行编程。通过两种分类算法的比较,实验证明BP神经网络的准确性更好。在计算机判卷初期,通过教师和计算机共同阅卷的方式评阅主观题。由于主观题评阅辅助系统是个自适应系统,它会随着实验样本的增多而不断优化,最后实现计算机独立评阅主观题的目标。
其他文献
课堂是动态的, 千变万化的.当课堂“意外”发生后, 教师可以运用教学机智, 充分利用“意外资源”, 创造性地开展教学活动.对“亮点”资源, 教师可以顺水推舟;对“错误”资源,
情境教学法是指教师在进行情境教学的过程中, 有意识、有目的地创设或引入具有一定情绪色彩或是形象、生动、具体的场景, 引导学生感受、体验知识, 帮助学生更好地理解教学内
随着教育改革的深入发展, 传统的班级受到了挑战, 如何使每个学生都得到更多的教育资源、更好地发展, 是教育者面临的问题.有机学习共同体可以让学生在合作中学习, 促进学生
良好的空间微重力环境是开展各类空间科学实验的重要保证,然而由于各种扰动的存在,空间站内部微重力水平并不理想。为此,美国、加拿大等国率先开展了微重力主动隔振技术的研究,并在航天飞机及空间站上进行了主动隔振装置的技术验证和实际应用。随着我国载人航天工程的逐步推进,未来将有大量空间微重力科学项目在空间站开展实验研究。为了满足空间科学实验对高微重力环境的要求,中国科学院空间科学与应用总体部研发了一套空间高
作为乳化炸药生产工艺的一个重要环节,配料的好坏直接关系到炸药质量的高低,对整个系统的安全性具有极大的影响。而目前乳化炸药生产的自动化程度不高,劳动强度大,生产过程中
随着经济与社会文化的发展、人们业余生活的丰富,大型场馆的商业化使得其承担着越来越多的包括娱乐活动、文化活动、体育活动等商业活动,场馆的每次活动都伴随着大量的人群聚集