异常成绩检测系统设计

来源 :教育科研 | 被引量 : 0次 | 上传用户:wumingshan2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要数据质量对于学生成绩具有十分重要的意义。本文在分析成绩上报的业务流程和成绩元数据的基础上,将异常成绩检测与业务相结合,给出异常成绩检测系统的设计原型。本文的工作不仅对于提高成绩的运行质量有直接的作用,而且为将数据质量研究成果应用于教育信息化领域提供了良好的开端。
  关键词数据质量;异常成绩检测;成绩管理系统
  AbstractInformation Quality to Student grade has fundamental significance. Based on analyzing the business process of grade report and grade of metadata, having combined the detection of grade-outliers with process, we propose a prototype design of grade-outliers detection system. The results of this paper not only have directly effect for improving the quality of grade, but also have provided a fine start to apply the study of Information quality to educational informationization.
  Key wordsInformation Quality;Detection of Grade Outliers;Achievement Management Information System
  
  当今社会信息化程度不断提高,大量信息系统广泛应用于不同领域,积累了海量数据。为了使信息系统能够有效可靠地支持组织的工作运行,要求系统的数据必须准确的反映现实世界的真实状况[1]。然而在实际运行的系统中,数据重复、数据缺失、数据不一致等问题普遍存在,数据质量(Information Quality)问题日益突出,引起了学术界和企业界的高度重视。为了适应高等教育改革发展的需要,教育信息化已经取得了很大的发展,各个高校的教务管理基本上实现了信息化。与其它领域类似,在教务管理信息系统中也出现了许多的数据质量问题,给学校的管理带来了不便。由于成绩与学生的评优评先、升留级、毕业、学位等密切相关,其数据质量尤其引人注目。通常,成绩管理部门认为成绩中不真实成绩所占比例越少则数据质量越高。从数据的生命周期来看,数据质量提高手段可分成两个类型:事前预防、事后检测[1],前者一般采取管理手段以减少脏数据进入信息系统,后者多采用数据清洗技术以减少系统中的脏数据。
  
  一、业务分析
  
  学生成绩的产生通常要经过评分、汇总、登分几个步骤。教师阅卷评分时,有时会出现误判;成绩汇总时,有时会发生计算错误;在登分时,有时会出现输入错误。这样产生的不真实成绩,会引起学生的疑问,带来大量的成绩复核,从而影响成绩的权威性,给教学管理造成不良的影响。因此不真实成绩是影响成绩数据质量的主要原因。人员操作失误是造成数据集中离群点或孤立点(outlier)的主要原因之一,因此通过检测成绩中的离群点能够有效地发现不真实成绩,从而改善学生成绩的数据质量。近几年,国内研究者对教育信息化领域的异常数据挖掘进行了初步的尝试[2,3,4,5,6],其中文[4]提出了基于分布特征的异常成绩检测方法,并通过抽取真实成绩进行实验证明了该方法的有效性。
  成绩数据是通过成绩上报业务进入教务管理信息系统的,因此它是影响数据质量的关键业务。如果将成绩看作信息产品,它的生产过程存在3种角色,数据收集者(data collectors)、数据管理者(data custodians)、数据消费者(data consumers),研究表明数据生产者对数据质量的影响最大[7]。任课教师是成绩的生产者,因此他们是整个业务中的质量关键点。在成绩上报时,任课教师对录入成绩进行异常检测,尽可能从源头减少不真实成绩进入系统,意义尤其重大。同时,从检测效率考虑,成绩上报的级别越高,记录数量越大,检测时间越长,效率越低,因此应尽可能在录入阶段进行检测,以减少不真实成绩流入系统。
  
  二、系统设计
  
  因为办公地点分布较广,并且网络接入方式各异,所以系统选用B/S模型。这样不但可以解决上述问题,而且大大简化了客户端电脑载荷,减轻了系统维护与升级的成本和工作量,降低了用户的总体拥有成本(TCO)。
  成绩元数据有:学生ID、课程ID、学年、学期、平时成绩、考试成绩、总评成绩等,学生元数据有:学生ID、学号、姓名、性别、身份证号等;课程元数据有:课程ID、课程号、课程名称、考核方式、学时、学分等。学生通过班级与所属专业、院系关联,课程通过开课信息与任课教师、教研室等信息关联。
  (一)用户界面层
  异常成绩检测流程为:选择待测成绩,确定检测方法,返回检测结果,用户对试卷进行复核。因此可以确定三个界面:①待测成绩选择界面;②参数设置界面;③检测结果界面。如图1、图2、图3所示。因为成绩是按课程分批录入的,根据元数据的分析可知,课程由学院、专业、教研室管理,因此①中应提供上述层次以选择待测课程。由于课程具有时间属性,所以①中还应提供学年、学期选项。在选定待测课程后显示所含全部记录,用户可选择一条或多条待测成绩。异常检测是将待测数据与参照数据进行对比,用户应可以选择检测方法及相关参数,如:待测课程、参照课程等。然而,大部分用户不具备异常数据检测的相关知识,因此系统不提供检测方法的参数值设置。这样,既可提高系统灵活性,又可保证检测的可靠性。因此界面②中,提供手动、自动两种检测方式,以及检测方法、参照课程选项。由于元数据中存在三种成绩,故增加成绩选项。界面③中将检测结果(异常成绩、OK)以不同颜色返回给用户。
  


  图1 待测课程选择界面
  


  图2 参数设置界面
  


  图3 检测结果界面
  (二)业务逻辑层
  无论采用何种异常成绩检测方法,都可看做将待测成绩与参照成绩通过某种算法做运算,获得计算结果。今后可能添加新检测方法,以及参照课程生成方式,所以应对它们进行封装。这两种封装是有所区别的。前者目的是封装不同的检测方法,也就是说,当增加新的异常成绩检测策略时,系统结构保持稳定不变。因此采用了策略模式(Strategy),通过抽象定义公共接口,实现对不同检测方法的封装;后者目的是实例化不同的参照课程对象,即根据参数实例化出合适的参照课程集合,所以使用了简单工厂模式(Simple Factory),利用多态性生成不同的参照课程对象。
  


  图4 业务逻辑层类图
  图4为业务逻辑层的类图。当添加新的检测算法时,只需继承接口OutlierDetectionStrategy,生成新算法类;同样,当新增 Cold对象时,只需继承抽象类AbstractHistoryScore,生成新的对象。此外,当要对某算法进行修改时,只能修改相应类,不会影响其它算法类,从而使系统对修改关闭。
  
  三、小结
  
  本文从数据质量管理的角度出发,确定成绩上报为影响成绩质量的关键业务,且任课教师为其中的质量关键点。在分析业务和元数据的基础上,将异常成绩检测与业务相结合,给出异常成绩检测系统的设计原型。本文的工作不仅对于提高成绩管理系统的运行质量有直接的作用,而且为将数据质量研究成果应用于教育信息化领域提供了很好的开端。
  
  参考文献
  [1] 韩京宇、徐立臻、董逸生. 数据质量研究综述[J]. 计算机科学, 2008, 35(2):1-5.
  [2] 黄万华、陆声链、林士敏. 孤立点挖掘在教务管理中的应用研究[J]. 广西科学院学报, 2004, 20(3):155-158.
  [3] 赵泽茂、何坤金、胡友进. 基于距离的异常数据挖掘算法及其应用[J]. 计算机应用与软件, 2005, 22(9):105-107.
  [4] 阳小华、李 萌. 基于分布特征的异常成绩检测方法[J]. 南华大学学报自然科学版, 2008, 22(4):7-9.
  [5] 陆声链、林士敏.基于距离的孤立点检测及其应用[J]. 计算机与数字工程, 2004, 32(5):94-97.
  [6] 庄严. 基于距离的异常数据挖掘在成绩检测中的应用[J]. 中国教育信息化(基础教育), 2007, 1:43-45.
  [7] YANG W. LEE, DIANE M. STRONG. Knowing-Why about data processes and data quality[J]. Journal of Management Information Systems, 2003, 20(3):13-39.
其他文献
摘要 本文介绍了数字建模与仿真在《微电子器件与系统》教学中的作用,利用matlab、3DMAX等软件进行建模与仿真,可以直观的表现器件与系统的功能,有利于教学水平的提高,并得到学生的认可和欢迎,根据教学实例的验证,可以确定数字建模与仿真在微电子器件与系统教学中有着重要的作用。  关键词 数字建模与仿真;微电子器件与系统;教学实例    自21世纪以来,随着电子科学与技术的飞速发展。器件与系统的种类
期刊
摘 要本文阐述了我校工程技术训练(金工实习)课程内容体系改革研究成果,提出了从“单一型技能训练”到“综合型工程实践”、从“验证型工程训练”到“设计型创新实践”多层次工程训练模式,介绍了挂图、模型、视频、多媒体、实物装备等多种教学手段,阐述了深化工程技术训练教学内容、课程体系、教学方式改革内容,提出了打造水平高、综合素质强、结构合理、具有创新力的优秀教学团队步骤。  关键词工程技术训练;课程内容体系
期刊
摘 要随着时代的发展,中学生与网络越来越近。网络既是中学生成长的知识宝库,也有可能是其成长道路上的“电子海洛因”。只要我们正确引导,就能发挥网络对中学生的积极影响,控制和减少网络的消极影响。  关键词中学生;网络;分析;对策    中学生随着时代的发展,与网络越来越近。网络,既可能是中学生成长的知识宝库,也可能是中学生成长道路上的“电子海洛因”。自律的中学生能得益于网络的影响,反之则受害于网络。 
期刊
摘 要嵌入式系统是为了专用目的内建到产品内部,实现控制、管理、通信等功能的计算机电路与软件的集合体。随着Internet的发展和后PC时代的到来,嵌入式系统的应用越来越广泛。本设计的目的正是建立一个完整的基于ARM9核心处理器和嵌入式Linux操作系统的嵌入式开发平台,为嵌入式系统开发提供一个完整的软硬件环境。  关键词嵌入式系统;ARM;内核;μC/OS-Ⅱ    嵌入式系统(EmbeddedS
期刊
摘 要本文分析了现阶段我军特种部队格斗训练中存在的问题,并提出了加强我军特种部队格斗训练科学化的对策。  关键词特种部队;格斗训练;对策  AbstractThis article figures out the problems of the combat training in the special force of our army and put forward the correspo
期刊
摘要 全面实现高校思想政治理论课教学状况明显改善的目标,必须分析当前高校思想政治理论课的现状,探讨改善的对策和路径,这既是建立长效保障机制的前提,也是关系到国家发展和民族未来的重大课题。  关键词 思想政治理论课;现状分析;明显改善;对策研究    中央宣传部、教育部联合召开的加强和改进高校思想政治理论课工作会议,提出要从国家发展和民族未来的战略高度,充分认识加强和改进高校思想政治理论课的重要性、
期刊
摘 要随着社会市场经济的发展,高级技术人才严重短缺。职业中学教学条件的不足,实践操作教学很难完成。因此,虚拟教学是解决这一难题很好的手段,以桂林工业中等专业学校数控机床虚拟教学为例,数控虚拟教学取得了一定成果。还讨论了虚拟教学在机械模块组装和机械设备维修课程中的应用。电子电路课程的虚拟教学方法。虚拟教学在职业教育中的应用,提高了教学质量,节约了成本,为社会培养了一批批合格技术人才。  关键词虚拟教
期刊
摘 要服装表演是一种肢体语言,它跟舞蹈艺术有非常多的相似点。在服装表演中,舞蹈美感的运用又是至关重要的。舞蹈美感是人们对客观存在的舞蹈美的一种主观反应,它也是舞蹈美作用于社会生活和影响人们的情感与思想--精神世界的中介。舞蹈是极具美感的艺术行为,模特在服装表演时又是极具美感的视觉享受,二者都是极具美感的行为。所以在服装表演中,是可以借鉴舞蹈的.  关键词服装表演;模特;舞蹈    在艺术创作上,一
期刊
摘 要本文浅谈古代山水诗“清淡”之风的形成,是从山水诗的萌芽时期说起,直到山水诗的产生阶段;从六朝中的谢灵运谈到初唐时期的张九龄;最后论述到盛唐时期著名的“清”派山水诗的代表人物“王猛”。由于社会经济、政治思想以及文学自身的发展等诸多方面的原因,内容充实、清新淡雅、脍炙人口、意境悠远的我国古代山水诗画卷才展现在了我们后人的面前。  关键词山水诗;清淡;形成    所谓山水诗,是指以山水等自然景物为
期刊
摘 要对于我们这一届的实习,大部分基地校对待实习还是持积极的态度,有的学校对实习生很欢迎,有的学校表示实习生对教学的确有冲击,也有的学校领导则直言不讳的说听课、见习多长时间都可以,上课就不能再给课时了。在指导教师配备上情况不一,一些学校使用没有中级职称的青年教师作指导老师。  关键词实习生;困扰;关注    实习过程中,大部分学生体验了课堂教学工作,但有45%的学生在实习期间没有被安排班主任实习。
期刊