【摘 要】
:
传统的数据库管理信息系统不能够很好地利用、分析数据库中积累的大量数据,数据挖掘与数据仓库技术很好地解决了这一问题。本文首先介绍数据挖掘和数据仓库的相关知识,包括数据
论文部分内容阅读
传统的数据库管理信息系统不能够很好地利用、分析数据库中积累的大量数据,数据挖掘与数据仓库技术很好地解决了这一问题。本文首先介绍数据挖掘和数据仓库的相关知识,包括数据挖掘与数据仓库、联机分析处理、统计学之间的关系,接着详细论述了数据挖掘模式和数据挖掘过程模型,重点讨论了聚类模式中的动态聚类算法,并采用主成分分析法预处理数据,在此基础上提出了动态聚类的改进算法。 作为一个应用实例,本文在分析超市业务数据库的基础上,用星型架构的方式建模,构造出一个数据仓库的逻辑模型;然后从超市业务数据库中抽取数据,经过转换等处理,把“有价值的、干净”的数据加载到数据仓库中,完成数据仓库的构建。参照Two Crows数据挖掘过程模型,首先收集客户购买产品的类型、交易、属性等数据;然后采用主成分分析法预处理这些数据,以降低数据之间的相关性和减少变量个数;接着采用改进的动态聚类方法建模,在聚类过程中剔除异常点,改善聚类的质量,最终得到一个客户分片的模型,并对该模型作了比较详尽的解释。 数据挖掘和数据仓库有很紧密的联系,数据仓库是数据挖掘一个良好的奠基石;数据挖掘使数据仓库的决策作用得到更好的发挥,所以数据挖掘和数据仓库系统的无缝集成是数据挖掘界的一个热点。作为一种发展趋势,本文对此也作了进一步的论述。
其他文献
随着无线网络技术的不断发展,无线Ad hoc网络中,快速变化的网络拓扑影响着网络的性能。因此,在实现网络能量优化的前提下,如何提供有效的QoS服务来满足多业务要求是无线Ad ho
目的: 测定不同时相和面积脑梗死患者血清血管内皮生长因子(Vascular endothelial growth factor,VEGF)水平,探讨急性脑梗死患者血清VEGF的变化规律。通过血清VEGF的变化,预测
民用航空运输系统在整个交通运输系统中占据着重要的地位和作用。机场是航空运输系统的一个组成部分,是民航一切活动的中心,是民航系统结构最复杂的子系统。本文运用交通运输系
随着经济全球化和信息化的发展,以有价证券为代表的虚拟资产与国民生产总值相比较所占的比重越来越大,且增长的速度越来越快;人们的价值观、财富观发生了深刻的变化,在拥有物质财
为了提高居民的生活水平与生活质量,需要对老旧小区进行整体的改造,其中老旧小区排水管网改造工程是整个改造方案的重中之重,本文通过查阅相关资料,在多年的工作经验的基础上
<正> 三、词语的文化背景知识词语不仅能表达某一客体的概念,而且还能在人们的头脑中引起各种联想.联想作为心理现象,是一种"取决于先前经验的概念之间的联系,即由于在意识中
城市园林设计在很大程度上决定了园林植物的密度和配置结构。当前,我国的城市园林设计中还存在着诸多问题,尤其是缺乏对植物保护策略的考虑和研究,引发了一系列的病虫害现象
<正> 一般说来,英语词义比较灵活,词的涵义范围比较宽,比较丰富多变,词义对上下文的依赖性比较大,独立性比较小。汉语词义比较严谨,词的涵义范围比较窄,比较精确固定,词义的
大众体育作为我国体育事业的重要组成部分,它关系到人们体质的增强,健康水平的提高和生活质量的改善,是现代社会文明进步的重要标志。伴随着改革开放的不断深入,经济和社会的发展