论文部分内容阅读
随着HSK的考试规模不断扩大,HSK成绩积累的越来越多,使用传统的数据分析方法已不能有效地利用这些数据,数据挖掘技术的出现为大型数据处理提供了一个有力的工具。利用挖掘技术可发现数据中隐藏的规律或模式,并找出隐藏在成绩中的多元关联关系。本文的研究是围绕HSK成绩展开多元数据挖掘分析,挖掘影响学生学好汉语的各种因素及其之间的关系,建立少数民族汉语教学学科建设的决策模型。因此,主要的研究工作如下:(1)收集和整理新疆师范大学2005年到2009年共十次的HSK考试成绩数据,对原始数据进行清理、集成、转换和导入,使之满足数据挖掘工作对数据精度的要求。(2)利用认知心理学理论和建构学习理论,确定多元挖掘维度分别是专业、年级、年龄层次、性别。采用关联规则方法中经典的Apriori算法,实现关联规则挖掘的程序设计,并得出关联规则结果。(3)在关联规则基础上,构建少数民族学生提高汉语水平的培养决策模型,并验证结论的有效性;依据分析结果,提出有针对性的建议,为少数民族汉语教学的学科建设提供理论和数据支持。通过分析得出如下结论:(1)本校理科类专业的少数民族学生参加HSK考试人数较少,但在汉语水平达到合格、良好层次的比率高于文科类专业的学生;达到优秀的比率没有这种特征。(2)学生汉语水平发展随着年级的增长而有所提高,专业课程的汉语教学环境促进了学生汉语能力的提高。(3)男女生间存在较大的成绩差异,对语言的学习一般女生优于男生。这些结论恰好印证了认知心理学和影响语言学习的主客观条件,说明少数民族汉语教学附合认知规律。随着社会的进步和网络的发展,对少数民族的汉语教学提出更高要求,因此从学科建设上来说还需要再进一步加强。