可视化数据挖掘方法的研究与实现

被引量 : 0次 | 上传用户:hudan913000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机软硬件的飞速发展和互联网络的逐渐普及,人们通过Internet和各种移动数字设备所收集到的数据正以日新月异的速度迅速增加,我们正生活在一个浩瀚无边的数据海洋之中。如何从这些海量数据中发掘出有用的知识成为了当今一个热门的研究领域,数据挖掘就应运而生。在数据挖掘的理论研究与实际应用中,与可视化技术的结合就催生了另一门重要的学科——可视化数据挖掘。利用相关可视化技术并结合人的视觉优点和主观认知,把数据挖掘过程以直观和可交互的形式展现在用户面前,从而挖掘出更有价值并易于理解的知识以便于决策。本文在一个基于Web的分布式数据挖掘系统——MinerOnWeb系统的基础上,对数据挖掘中的可视化技术及其实现进行了重点阐述。MinerOnWeb系统是计算智能实验室数据挖掘小组研发的一个数据挖掘服务系统,它集成了分类、聚类和关联规则挖掘的一些成熟算法,能够处理多种文件格式的数据。它的开发遵循J2EE规范,采用了Struts架构。本人重点研究和分析了2D/3D两种数据挖掘可视化技术,然后将这些技术应用在MinerOnWeb系统的如下三个方面:(1)基于3D散点图的源数据可视化:实现了源数据的获取;基于3D的源数据可视化技术为预处理阶段提供了更直观的数据分析;通过属性选择,可以将三维或者四维的数据在3D坐标上展示出来,并且可以随意旋转、平移、缩放和定位。(2)基于2D表格的关联规则挖掘可视化:通过比较各种传统的关联规则挖掘结果表示方法,提出以2D表格这种可视化技术来展示关联挖掘结果更具有优越性。以直观的2D图形和规范的表格相结合来形象地展示关联规则,同时提供属性过滤和交互式选择功能,以使关联规则挖掘结果更直观。(3)基于SOM(Self-Organizing feature Map)的聚类挖掘可视化:由于SOM网络的计算具有黑箱性,为了能更直观地了解自动聚类的特点,本文设计并实现了SOM聚类挖掘可视化模块,利用直方图、散点图和二维表等多种可视化技术,提供聚类挖掘结果可视化展示功能。
其他文献
城市公园的入口空间是城市公园的重要组成部分,发挥着独特而关键的作用。入口空间是沟通公园内部与外部的桥梁,同时它与道路,广场,街区等一起组成城市的空间体系,对城市的景
近年来,随着我国改革开放力度的加大,市场经济体制也日渐完善,外部的经济环境发生了很大的变化,市场竞争也日趋激烈,作为企业发展的基础内容,财务会计管理也开始受到了人们重
发作性运动诱发性运动障碍是由突然的运动所诱发的不自主运动,因其具有复杂的临床表征,所以这种疾病的病理机制目前依然不清楚。尽管之前研究也调查了这种疾病的两种疾病亚型
杜鹃花是我国传统名花,也是世界著名的观赏植物。在自然生长条件下,杜鹃花科的大多数植物根系与土壤真菌形成互惠的共生体,称之为杜鹃花类菌根。这一共生关系对幼苗定居与植
LED在照明应用中,因其具有节能、寿命长、环保、体积小、响应速度快、可靠性高、调控方便等诸多优点,正作为一种新型照明光源并获得越来越广泛的应用。LED的照明应用,需要驱
因建筑施工空间日益狭窄,所以要求与之配套的施工机具的重量越轻越好,体积越小越好。而作为施工机具重要组成部分的千斤顶,其尺寸和重量的减小不仅使工作空间减小,而且节省工
共产国际、联共(布)与中国革命联系紧密,民主革命时期中共党史上的许多重大问题都有深刻的“国际”背景。对于共产国际、联共(布)与马克思主义中国化的研究,需要从历史的角度
<正>本书是北大出版社自《蒙牛内幕》后推出的又一个企业纪实的重磅作品。自从2005年联想并购IBMPC业务之后,联想就渐渐远离了公众的视线。整
随着社会的不断进步,经济的不断发展,人们生活水平的不断提高,人们出行活动的日益频繁,城市交通问题愈以成为一个迫切需要解决的重要课题。城市交通问题包括诸多复杂而又难以
中国农村金融正在进行市场化的改革。进入21世纪,中国农村金融逐渐放开,在国家政策的推动下,形成了由中国农业发展银行、中国农业银行、农村信用社三大金融机构形成的一种政