基于Web Service技术的分布式并行数据挖掘研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户：lytmxl

【摘要】

：

数据挖掘是指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则。它是近年来企业用以分析大型数据集的核心技术和知识发现过程中的关键步骤。

【作者】

：

马世欢

【机构】

：

西安工业大学

【出处】

：

西安工业大学

【发表日期】

：

2006年期

【关键词】

：

数据挖掘分布式数据挖掘 Web服务关联规则并行数据挖据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据挖掘是指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则。它是近年来企业用以分析大型数据集的核心技术和知识发现过程中的关键步骤。 Internet/Intranet的高速发展促进了数据库技术的深入应用，由于安全及通信成本、效率等多方面的原因，大量的分散数据不可能集中起来处理。同时，对挖掘系统的开放性和易用性的要求越来越高。分布式的数据挖掘就是在这样的背景下提出的。针对以上问题，本文讨论了一个基于Web服务的数据挖掘系统结构。它将Web服务这一技术引入了数据挖掘，并在解决上述问题方面做了一些尝试。本文在一个关联规则挖掘的并行算法CD算法的基础上，给出了一种基于动态数据集划分的并行关联规则挖掘算法。实验表明它能更好地实现负载平衡，提高并行数据挖掘的效率。然后本文基于WebService技术设计了一个数据挖掘系统平台，只要遵循我们的数据模型接口和挖掘模型接口，新的数据挖掘算法可以很容易地集成到系统中来。并且，我们的平台也是一个具有实际应用价值的、开放的和便于移植的挖掘系统框架。同时，为了避免大量数据传输造成的效率问题，本文将SmartClient框架引入了这个数据挖掘系统平台，让客户可以选择数据挖据是在客户端进行还是在服务器端进行，以充分地利用客户端资源。

其他文献

图像误差扩散半色调技术研究

数字半色调技术是联系模拟原稿或物理场景数字化转换与印刷的桥梁,是数字印刷乃至现代化印刷的关键、核心技术之一。目前这项技术已经被广泛应用到了印刷、水印、信息加密技

学位

数字半色调误差扩散间断扫描方式误差扩散滤波器

基于网格和密度的并行聚类算法的研究与实现

聚类是数据挖掘领域中的一个重要研究课题。随着聚类分析对象数据集规模的急剧增大，改进已有的算法以获得满意的效率受到越来越多的重视。其中对现有算法的并行化是针对海量、

学位

聚类算法集群系统数据并行任务并行数据挖掘小波聚类

基于PVM的CLIPS并行性的研究与实现

分布式人工智能是人工智能的一个重要研究领域，它要求一组分布环境下的智能实体通过合作来解决问题。从建立高速的分布式专家系统的角度出发，提出了利用PVM(ParallelVirtualMac

学位

分布式专家系统CLIPS语言信息传递功能并行性PVM消息传递机制

基于IMP技术的信息家电网络通信模型研究与实现

信息家电(IA，Information Appliance)，是信息处理技术、存储技术和网络通信技术与传统家用电器相融合的产物。随着家庭网络化、信息化的发展，信息家电间的网络通信变得十分重要

学位

信息家电网络通信OSGiIMP

基于Struts框架的决策信息管理系统的设计与实现

随着Internet技术的迅速发展，开发Web应用的技术日趋多样化和成熟化。框架为Web应用提供了预备的软件架构和相关的软件包，它大大提高了开发Web应用的速度和效率。Struts是在JSP

学位

决策信息管理系统日志管理业务流程功能模块

无线体域网中高可靠数据传输方法研究

无线体域网(Wireless Body Area Network,WBAN)在远程医疗、安全监护、文体娱乐等方面具有广阔的应用前景,受到了众多科研机构和高新技术企业高度重视。WBAN主要围绕人体来部

学位

无线体域网可靠性退避算法干扰缓解中继节点选择

基于嵌入式Linux的图形用户界面的设计与实现

嵌入式图形用户界面系统(GraphicalUserInterface，以下简称GUI)是嵌入式操作系统的一个重要组成部分，随着嵌入式系统硬件设备的可获得性的提高和价格的不断降低及嵌入式系统应

学位

嵌入式系统图形用户界面设计模式多进程

双目立体视觉实时视差算法研究

地面自主车因其重大的研究价值和应用价值,受到世界各国的重视。在地面自主车的各项关键技术中,视觉导航的主要功能是对各种道路场景进行快速识别和理解,从而确定移动机器人

学位

双目立体视觉视差计算区域匹配算法实时性算法

入侵容忍系统模型及基于门限的CA方案研究

入侵容忍技术是美国提出的第三代安全的核心。入侵容忍是一种主动防护能力，当受保护系统的部分组件受到攻击时，入侵容忍旨在能维持整个系统关键信息和服务的完整性、机密性和可

学位

入侵容忍RSAECCCA

基于异质信息网络的老鼠表型—基因关联挖掘研究

表型-基因关联预测和分析在疾病治疗、食物增产等方面具有重大意义，是生物信息学中的核心问题。在人类疾病表型-基因关联研究中，由于受到法律、成本、时间等因素的制约，已知的表

学位

表型-基因关联异质网络数据挖掘跨物种随机游走

基于Web Service技术的分布式并行数据挖掘研究

其他学术论文