数据挖掘集成技术研究和实现

来源 :贵州大学 | 被引量 : 0次 | 上传用户:freezinghk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文探索数据挖掘中的集成和实现问题.在介绍数据仓库、OLAP和数据挖掘发展和特点的基础上,重点研究数据挖掘与OLAP的集成思想及其实现.OLAP是一种以多维的角度总结、重组、观察、应用和组织数据的计算技术,允许多维数据库用户产生在线可描述的或可比较的数据汇总以及其它分析查询.数据挖掘是一种数据探索工具,它包括几种技术/算法,如关联规则、归约分析、聚类、分类、预测等.分析者能够独自地或结合地使用这些技术,以获取和发现有趣的模式和关系用于战略和战术决策.数据仓库是一种以方便地获取分析信息为目的,组织大量的和多维的数据集的过程.OLAP和DM都同样需要数据仓库提供高质量的数据.OLAP本质上是回顾性的、专家驱动的和演绎的.与之相比,数据挖掘是前摄的、数据本身驱动的和归纳的.OLAP和DM两种技术在数据分析中组合实施能产生好的效果.概括起来它们之间有以下几个方面的集成:(1)用数据立方体描述和表现数据挖掘的结果;(2)在选定的子立方体上进行数据挖掘;(3)应用数据挖掘算法(如归约、聚类、关联)准备和改进更有意义元数据模型,以帮助建立OLAP立方体;(4)在立方体上使用各种数据挖掘技术,可以发现立方体中有趣的区域或异常等.结合本人近几年对学生成绩和教师业绩统计与分析的工作经验,集成应用数据仓库、OLAP和DM等技术和工具编程实现成绩的查询和分析.具体实现了各科成绩关联分析、学生成绩趋势分析、学生成绩分布分析、教师业绩分析、学生和教师成绩查询,它们对学校学生成绩的分析和管理具有很大的实践意义和应用价值.
其他文献
RMESH模型是一种近十几年才被提出并迅速发展起来的并行计算模型,其最大特点是算法执行过程中总线结构可以动态改变,这种结构上的灵活性带来了性能上的优越性.该文着重从计算
基于SHALE计算模型,应用面向对象程序设计方法,实现了SHALE计算内核的Fortran到c++代码移植.基于对ANSYS LS-DYNA的分析,开发了适用于该计算核心的前、后处理子系统,将二维AL
随着网络信息技术的发展,公钥密钥基础设施(Public Key Infrastructure)已得到广泛的应用,成为构建电子商务重要的安全保障,已取得很多重要的成果.随着网络结构的越来越复杂,
XML(eXtensible Markup Language)已经成为了因特网上数据表示和数据交换的主要标准.越来越多的信息系统选择XML作为信息交换的手段.另外,由于目前出现了一些特定领域的DTD(D
该论文研究把网络流量控制看成是如下的三个方面的结合:路由器上的AQM、路由器间的路由选择和端系统的TCP源,该论文重点选取队列调度算法作为研究的重点,提出了一种新的调度
GIS(地理信息系统)的一个主要功能是管理大量的地理空间数据,按专题分类将各类地理数据组织起来,按照一定格式将数据存储在计算机中,为各种开发应用提供数据支持.伴随着GIS应
网页结构相似度的衡量在数据仓库、视图增量维护、分布式镜像、信息检索、信息抽取等很多领域具有重要的应用.近年来随着互连网上信息的迅速膨胀,信息集成与抽取逐渐成为人们
本文针对"模拟电子技术课件"的网络开发问题,进行了网站建设和图像压缩的研究.本项目以建立"模拟电子技术课件"的网站建设为目标,根据网站建设的需求分析,选用"双主模式"的教
移动通讯网络的异构性和动态性使其故障诊断相当困难.由于检测到故障的网络部件只是从自身有限的视角出发报告告警,而在单个故障可能引发多个告警的情况下,并非每一个告警都
从发展的角度来看,下一代网络(NGN)是在传统的以电路交换为主的PSTN中逐渐迈出了向以分组交换为主的步伐,它承载了原有PSTN的所有业务,同时把大量的数据传输卸载到IP网络中以