教务管理信息系统伪缺失值检测研究

来源 :南华大学 | 被引量 : 1次 | 上传用户:zhongdezhufangchuxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化程度不断提高,大量信息系统广泛应用于不同领域,积累了海量数据。为了使信息系统能够有效可靠地支持组织的工作,要求系统的数据必须准确的反映现实世界的真实状况。而在实际运行的系统中,数据重复、数据缺失、数据不一致等问题普遍存在,数据质量(Information Quality)问题日益突出,引起了学术界和企业界的高度重视。本文面向高校教育信息化,针对学分制教务管理信息系统中出现的数据质量问题进行了深入的探讨和研究,认真分析该系统各个功能模块中出现的数据质量问题,并以解决学籍管理模块中出现的伪缺失值问题为研究重点。针对数据库中存在的伪缺失值问题,本文首先介绍伪缺失值的定义以及常见的伪缺失值检测方法,比如:基于统计的方法(又包含基于分布的方法和基于深度的方法)、基于距离的方法、基于密度的方法、基于聚类的方法、基于偏离的方法等。伪缺失值记录是指用户没有进行某项信息填写时系统采用属性值域内的某个合法值缺省填入数据库中而产生的与实际不相符的记录,该类记录的大量存在给数据分析统计(假设性检验、相关性分析和回归性分析等)的结果带来严重的偏差,现有方法在伪缺失值被大量使用的情况下检测效果不是很理想,为了有效的检测出教务管理系统中存在的伪缺失值记录,本文结合无偏样本同分布相关的原理以及教务管理系统的实践应用要求,提出一种简化的基于单属性同分布原理的伪缺失值检测算法,并应用教务管理信息系统中的学籍信息数据对算法的有效性和可行性进行实验验证。最后在认真分析伪缺失值产生机制以及教务管理信息系统业务流程的前提下,从面向对象程序开发的角度,对伪缺失值检测模块进行设计,确定检测操作的用户界面,绘制业务逻辑层的主要设计文档,包括:流程图、时序图、类图,详细分析并确定了数据访问层主要存储过程的功能。完成伪缺失值检测模块与现有教务管理信息系统集成的基本设计工作。
其他文献
在计算机图形学和计算机辅助设计中,需要对所设计的作品从不同的角度进行观察,所以要把物体放在三维空间中,从各个方向上观察和展示设计作品。所以,如何设计一个好的三维图形
随着当前高能物理实验规模不断扩大,数据量在急剧地积累,这对于计算资源形成了巨大的挑战,而分布式计算成为解决这一问题不可或缺的资源组织方式。为了满足实验数据处理和分
随着信息技术的飞速发展,特别是互联网的发展,网络上的资源日渐丰富,获取信息也变得更加的方便和快捷,同时抄袭也变得更加的容易。使用文章比对系统能够实现对论文的自动比对
随着企业信息化的推广,越来越多的企业认识到利用信息系统管理企业内部信息的重要性与必要性。可靠、准确、快速和实用的管理信息系统成为当前的一种实际需要。本文结合印染
图形用户界面GUI(Graphical User Interface)是用户和软件交互的一个可视化平台。近年来,软件规模日益扩大,软件系统中图形用户界面的应用越来越广泛,但是由于GUI控件的复杂
随着Internet的不断发展,使得人们不再仅仅将其作为一个信息平台来看待,而是越来越注重将其看作是一个具有巨大潜力的计算平台。因此,过往的静态、封闭的计算环境已经无法适
信息隐藏和数字水印的研究是在20世纪90年代受到重视并蓬勃发展起来的,但是追根溯源,信息隐藏的前身——隐写术早在公元前就被使用了。20世纪90年代的兴起并成为热点研究方向
在网格环境中,越来越多的用户对资源提出了不同的QoS需求,但传统调度算法的目标是最小化时间跨度,改进系统性能,却没有考虑用户的服务质量要求,导致一些任务调度到不符合其要
课程相似度计算指的是定量地计算两门课程所包含知识点的交叉程度。在很多情况下,我们希望了解两个专业间的相似程度,例如新生入学选择专业时,大学生跨专业考研时,以及毕业生
专家系统是人工智能中最重要的也是最活跃的一个应用领域,它实现了人工智能从理论研究走向实际应用,通过推理来模拟通常由人类专家才能解决的各种问题,达到与专家具有同等解