基于图的关联规则数据挖掘算法的研究及其应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:hnxblj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,数据积压现象越来越严重,人们面临海量数据却无从下手,数据挖掘技术的诞生,使得人们从这样的尴尬情形中解放出来。作为数据挖掘领域的一个重要分支,关联规则数据挖掘由于其简单、易于表示和理解而得到了广泛的研究。关联规则数据挖掘存在两类代表性算法,一类是以Apriori算法为代表的候选项集至频繁项集迭代算法;另一类足以FP树算法为代表的无需产生候选项集的频繁项集生成算法。本文针对关联规则数据挖掘做了理论上的研究并且在此基础上对研究生信息数据库进行了挖掘实验。   本文主要做了以下几个方面的工作:   (1)研究基于图的关联规则挖掘算法DLG,研究数据库事务的矩阵编码、候选项集的剪枝方案、频繁项集的图搜索策略,并在此基础上提出了改进算法CAG。   (2)根据研究生数据库的实际情况,提出了在数据预处理阶段中两种数据抽取策略:外键关系查询和类公交换乘算法。其中重点分析了类公交换乘算法如何实施于研究生信息数据库中,该算法具有一定的通用性,适用于数据库比较庞大的情形。   (3)在关联规则挖掘中,连续型数据通常都要采用离散化处理方案,才能应用于挖掘算法。传统的离散化方法只是将数据按照经验来划分为若干个区间,然后判定数据散落到哪个区间,从而达到离散化的目的,文中采用改进的k-means算法对数据进行了离散化处理,更加合理地对数据进行了分类。   (4)利用关联规则的相关算法,以研究生信息数据库为基础,从两个方面对研究生信息数据库进行了挖掘:一方面是学生综合素质,包括学生的基本信息、总成绩学分、学生发表的论文等等;另一方面是教学质量评价,包括学生每门课的成绩、相关的课程信息、以及任课的老师信息等等,完整地演示了数据挖掘的流程,最终得出了一些有用的结论。
其他文献
随着计算机科学技术的高速发展,三维模型因其较二维图像更为接近现实、更符合人类视觉习惯和更生动直观的立体效果,广泛地应用于虚拟现实、文物考古、医疗成像系统以及影视游
随着科技的发展,信息技术已经深刻的影响着人类的方方面面,而数据海量化给存储技术带来了巨大挑战。相比传统的存储系统,分布式存储系统通过利用大量的小型服务器甚至个人PC
农村农产品卖难问题一直阻碍着农村经济发展,而城市农产品买难也日益凸显,为了克服双方的障碍,本文工作的主要目的是为农民设计农产品电子商务概念和交互原型,以期让农村的农
在科学领域与信息技术不断地迅速进步的近些年来,信息共享与资源互利已经越来越受到人们的各种关注。与此同时,这些信息资源给人们带来各种生活中的好处,也带来了人们隐私数据信
随着计算机数字化和可视化技术的发展,对文化遗产的数字化保护和虚拟展示也提出了更高的要求。秦始皇陵陪葬坑中的兵马俑文物原本是周身彩绘,但由于千年来的自然侵蚀和考古发
随着信息技术和多媒体技术的快速发展,音乐已经成为人们日常生活中不可或缺的多媒体资源之一。同时,音乐作为人类最重要的交流媒介之一,包含着丰富的情感信息,利用计算机技术来分
虚拟现实技术是伴随多媒体技术发展起来的计算机新技术,采用三维图形生成技术、高分辨率显示技术和多传感交互技术,生成一个逼真的三维虚拟环境。虚拟现实技术的应用前景是非常
随着企业业务流程的日益复杂,作为一种流程定义、管理和监控的核心技术,工作流技术已经得到广泛应用。一个完整的工作流管理系统一般应包括过程与任务定义、过程定义的完整性
在计算机网络技术飞速发展的背景下,互联网环境下的软件形态和功能正发生着深刻的变化,这给国产办公软件的发展带来了机遇,网络集成化办公已成为趋势。在该领域中,SaaS(Software-a
随着软件产品广泛应用于工业制造、金融、交通运输、军事等领域,随着软件的规模和复杂度不断增加,如何保证软件产品的质量和可靠性成为软件工程研究的重点和难点。软件缺陷是影