论文部分内容阅读
数据库中的知识发现(KDD)是近年来人工智能领域最富活力的研究方向之一。而数据挖掘(DM)是KDD的一个关键的步骤,它是从数据中提取潜在的有用知识的过程。
与数据挖掘相关的技术领域非常多,它不仅包括数据挖掘及知识发现,而且还关系到很多其它的研究领域,包括多元统计,数据库接口,信息检索等。在过去的十几年的研究中,人们在这些领域获得了重大的进步,发现了很多数据挖掘技术,并且很多已有的技术也得到进步。不仅对很多现有的技术进行了较大地改进,而且还提出了很多新的数据挖掘技术,开发出不同种类的数据挖掘工具。
本文将可视化技术应用到银行卡数据挖掘系统中,尝试在数据挖掘的系统中使用更多的可视化技术,用颜色、表格、图形等方式来进行数据可视化和知识可视化。研究表明,在数据挖掘中引入可视化技术,将多维、复杂的数据良好地表示出来,可以有效的提高了数据挖掘的效率和效果。
本文的研究工作主要有以下几个方面:
(1)首先介绍了本论文的选题背景。概要介绍了国内外可视化技术在数据挖掘中的研究现状,和可视化技术应用到数据挖掘领域的一些最新动态;并且介绍了可视化技术的概念和基础知识,技术的分类,可视化挖掘工具,着重介绍了本课题将会用到得一些可视化技术;
(2)阐述了软件设计时候的信息的封装和接口描述,确定了可视化系统模块的设计目标和所遵循的思想;
(3)结合银行卡项目研究和设计可视化系统的架构和数据流程。为提高可视化系统的可维护性和可移植性,提出可视化模块的独立封装和接口定义,对于可视化部分来说,数据挖掘算法是透明的、无关的。只要符合接口的标准定义,就可以达到多种方式的展示。
(4)可视化模块系统集成的多种的可视化工具展示方式,其中交互式可视化对分类算法得到的关联规则进行交互式问答展示,多次读取数据,允许和用户之间的交互,提高用户获得有用知识的能力。基于JFreeChart的图形可视化包括了柱形图,条形图,折线图,XY图等展示方式,并且为了减少数据库IO操作,提高可视化效率,在进行数据抽取转换装载(ETL)时,触发对分析库的对应数据属性进行了实时的汇总计算,并且保存计算结果提供给数据可视化时使用。设计实现
ADTree树形展示算法,通过前序遍历访问多叉决策树。确定数据源XML的标识格式,ADTree以Applet的方式嵌入到Web页面中,支持与用户更多的交互,实现了整棵树形的缩放以及节点的收放,分类模型节点信息可视化。