支持并行数据挖掘的分布式存储模型研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:saxthon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文旨在研究"自强2000"高性能并行运算环境下,并行数据挖掘试验平台中,数据及其运算的分布性和并行性规律,建立适用的分布式数据存储模型,有效地支持数据预处理和数据挖掘并行算法.首先,该文总结了数据挖掘的发展现状及其各种挖掘方法的特点,特别是并行化的研究进展.之后,探讨高性能计算机中的集群式并行计算机的工作模式,特别是在集群式并行计算机中广泛使用的环境平台MPI的工作方式,以及MPI的并行I/O工作特点等.接着,结合前两者的工作特性,重点研究并提出了一种分布式并行数据挖掘系统的存储模型,对存储模型中的主要模块,包括数据文件定义部分及网络缓冲区工作机理部分,进行了详细的分析.其中使用到的MPI并行化I/O也有更为详细的介绍.这也是我们工作的核心.最后,通过实验来测试前面提出的存储模型的工作效率,并对下一步的工作重点提出了展望.
其他文献
随着分布式计算技术的迅速发展,以及国内外CTI行业发展逐步走向成熟,分布式计算技术在CTI行业中的应用成为一个有着重要现实意义的研究领域.作者针对在实际的CTI项目应用中遇
该文主要围绕动态数据的安全保护,研究相关的密码机制和体制发展的现状和趋势,尝试从己发表的有效算法中提取核心部分——算子,重构新的算法;在此基础上提出了一种基于算子库
无线传感器网络具有信息收集能力强,信息收集速度快,准确率高等特点,可以适应各种环境,尤其是可以监测人类无法到达或极难到达的区域。数据安全是无线传感器技术研究的一个重
该文将Agent和GDSS结合起来,形成了基于MAS(Multi Agent System,MAS)的GDSS,提出了基于MAS的GDSS的总体框架,并且研究和提出了这个框架下的通信问题的解决方案.该文详细分析
语义Web作为一种能够理解人类语言的智能网络,是当前互联网技术研究的热点之一。在语义Web中本体发挥着重要的作用,它能够解决特定应用中的知识共享问题。但是由于各领域都有
该文主要侧重于研究易损数字水印方案,易损水印主要用于验证多媒体内容的真实性、完整性.以往的大多数文献主要是用一个额外的水印文件或者水印的比特流信息,然后将这个水印
文章首先介绍了与该课题密切相关的软件代理技术、软件重用技术、对象技术等研究现状;解释了分布式技术和组件技术的基本概念及各种特性;详细描述了COM/DCOM体系结构,面向对
该文通过对电子公文流程的建模、电子公文的表示语言、电子公文的结构设计、标准化的电子公文格式、电子公文交换的实现、电子公文数据的转换和存储、电子公文的处理以及电子
城市轨道列车以其高效节能的特点成为大中型城市公共交通的重要组成部分,因此城市轨道列车的速度控制优化成为公共交通控制领域的研究热点之一。在以往的城市轨道列车速度优化
在该文提出了一种新的Hopfield网络的学习算法——梯度上升学习算法.该学习算法中把网络的权值和阈值参数看作是一种可调参数.整个算法由两个阶段组成,分别是Hopfield网络的