论文部分内容阅读
由于互联网技术的快速发展,各类在线学习系统不断涌现,它们以其方便、人性化的特点,大有代替传统课堂式教学的趋势。然而网络的虚拟性,使得在线学习者身份的真实性鉴别较为困难。传统的身份识别方法如用户名与密码的组合验证,它只能说明用户具有登录权限,并不能说明用户为非冒充者;生物识别技术如人脸视频识别,它可以准确识别用户身份,但此类技术难度大,普及困难。在只保留学习者行为特征属性的情况下,基于数据挖掘技术的身份识别不失为一种新的尝试。数据挖掘是指分析数据,挖掘数据中隐含的模式。基于数据挖掘的学习者身份识别,指的是对学习者留下的一系列行为数据进行挖掘而得到学习者的行为模式,包括普遍行为模式和异常行为模式,再经聚类分析、分类预测、关联检测等处理,从而完成对在线学习者身份的识别,本文主要的研究内容有以下4点:(1)将数据挖掘中的关联算法应用于学习者的身份识别。定义了由关联分析产生的异常规则集,通过关联检测学习者的行为是否异常来识别其身份的方案,并分析了该方案的不足。(2)将数据挖掘中的分类算法应用于学习者的身份识别,通过建立学习者学习成绩判定的预测模型,给出了依据学习成绩可信度来确定学习者身份的真实性的决策树分类预测方案。以理论分析和实验验证相结合,分析和比较了贝叶斯、决策树、神经网络三种分类算法的识别效果。(3)分析了贝叶斯分类的特点,提出了利用贝叶斯分类来辅助决策树分类的身份识别方法,弥补了决策树分类不能完全考虑学习者所有行为项而影响最终成绩预测的不足,使得分类预测识别有了更好的效果。(4)提出了以聚类分析为基础的关联检测识别,通过先聚类后关联的方式产生的学习者异常规则集,它能更有效地检测出学习者的行为是否异常,因而可以避免误检现象。相比于直接关联检测,在分类预测的基础上再进行该检测方案,使得学习者身份的识别有了更好的效果。本文以数据挖掘理论分析和实验验证为基础,将数据挖掘技术中的分类、聚类、关联三种算法结合,提出了基于数据挖掘的学习者身份识别技术,在身份识别领域展现了一种新的思路。运用该识别技术构建了《计算机网络课程》个性化在线学习系统下的身份识别模块,它能有效地对在线学习者的身份进行识别,可推广及应用于诸如企业的网上员工培训、学校的网上党校等在线学习系统中。