关联规则发现及其在高校成绩分析中的应用研究

来源 :河北工业大学 | 被引量 : 15次 | 上传用户:langcy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化技术的发展和数据库的广泛应用,人们面对的数据规模迅速膨胀,面对这些海量、混乱的数据,传统分析方法已经无法满足人们对数据处理的需求,因此,寻求能够分析大量数据的技术成为一个迫切的需求,数据挖掘技术的出现恰好解决了这一难题。关联规则是数据挖掘中一种应用最为广泛的技术,它主要用于从大量、复杂的数据中发现各个属性之间的内在联系,得到有指导意义的规则,因而具有重要的实用价值。关联规则挖掘主要分为两个步骤:寻找频繁项集和生成规则;第一步是算法的关键,因此,如何提高寻找频繁项集的效率成为目前研究的重点。论文分析了Apriori系列算法的特点及不足,同时分析了一种改进算法-AprioriTid系列算法的优点及缺陷。针对关联规则中Apriori算法多次扫描数据库的缺陷,论文利用AprioriTid算法事务压缩的思想提出一种基于索引的Apriori改进算法。改进算法利用包含候选项集的事务标识列表计算候选项集的支持度;在剪枝过程中,采用地址索引机制减少对比次数;提出了一种快速连接事务标识列表求两列表交集的方法,并通过实验证明了算法的高效性。研究目前的关联规则衡量标准,在U检验思想基础上提出影响度衡量标准,该标准在一定程度上避免了其它标准的不足,而且能够找出无效关联规则和负关联规则,同时将正关联规则分为弱关联规则和强关联规则,给用户提供更加有效的关联规则。利用改进算法,以某高校计软学院2006级学生大学四年课程考试成绩为研究对象,通过数据清理、数据转换等数据预处理操作之后,挖掘课程之间和课程类别之间的关联关系,给出了挖掘结果并对部分规则进行解释。最后对高校成绩分析系统的总体框架和数据库进行设计;实现数据选取、数据清理、数据转换功能;挖掘前期,根据用户需求实现选择挖掘内容功能;挖掘过程中引入了规则模板,挖掘结果采用表格的形式显示,用户可以从大量规则中快速发现感兴趣的规则;同时用户可以对挖掘结果进行分类并将有效规则保存至规则库中。利用规则结果可以对学生学习成绩进行预警提示,同时辅助教学部门合理安排课程,从而达到提高学校教学质量的目的。
其他文献
语义Web本体是支持语义Web实际运行的知识库,它形式地定义了领域内共同认可的知识以及知识之间的关系,具体表示为领域内共同认可的概念以及概念之间的关系。在语义Web应用研
随着世界经济的复苏,港口建设掀起新的一轮高潮,为了提高港口运作的效率以及减少安全事故,港口的虚拟仿真监控逐渐成为研发的热门。随着3D技术的兴起,港口监控系统逐渐淘汰原
逆向工程技术是进行产品设计,研究和创新的一项先进技术。从获取的三维点云数据出发,对三维点云数据进行处理是逆向工程领域中的关键技术之一,其中点云数据配准技术是数据处
高光谱图像具有波段多,且图谱合一、分辨率高、数据量丰富,包含整个热红外、短波红外、近红外、可见光波段的多而窄的连续光谱等优点。使其在溢油检测、农业、矿石等领域得到
骨架提取是计算机图形学和可视化领域的许多应用中一个比较重要的问题。本文提出一种基于聚类分析的方法来提取三维网格的骨架。将Reeb图与聚类分析的方法相结合运用于骨架提
无人驾驶汽车的安全离不开车载自组织网络(VANET)的支持,论文主要对VANET无人驾驶汽车通信协议中的认证协议和密钥管理协议进行研究,发现VANET中现存的认证协议不能实现非本
无线传感器网络是由大量微型传感器节点通过多跳方式形成的特殊自组织网络,其主要任务是进行数据收集,即将监测数据由源节点以多跳的方式传输到基站。“空洞”是传感器网络数据
水利工程结构的灾变严重影响着人类的生活,危机人类安全。对工程结构灾变过程进行仿真有利于提高防灾减害水平。本文研究水利工程结构灾变仿真,采用一种预破碎模式结合PhysX
属性加密(Attribute-based Encryption,ABE)本身所具有的分布式性质和安全性性质使其天然适合应用于当前日益扩大的复杂的网络环境。但现阶段要将属性加密机制应用到实际生活
自1999年高校扩招以来,毕业生数量大幅度增加,毕业生就业形势日趋严峻,大学生就业困难已是不争的事实。面对新形势下的就业问题,搭建一个高效的就业管理信息系统,拓宽就业信