基于Web服务的数据挖掘系统关键技术的研究及其原型设计

来源 :苏州大学 | 被引量 : 0次 | 上传用户:wildboar2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据积累的越来越多,企业迫切希望挖掘出隐藏在大量数据背后的知识以支持决策。现有的数据挖掘工具如IBM的Intelligence Miner,SAS的Enterprise Miner虽然提供了较丰富的挖掘功能,但是这些工具不能够挖掘Internet/Extranet上的分布式和高度异质的数据,不能有效地与操作型系统集成,而且针对性不强。企业如果采用这些工具投资很大,某些挖掘功也用不上,而且算法库升级非常困难。本文提出了一种基于Web服务的数据挖掘系统架构。它能够与原有操作型系统良好集成,能够挖掘分布式数据库中的数据,而且具有跨平台、跨语言、易于部署和可动态管理算法库等优点。本文首先给出了基于Web服务的数据挖掘系统的总体架构,将Web服务这一优秀的面向服务的企业架构的实现技术引入了数据挖掘系统中。然后详细研究了构建数据挖掘系统的关键技术,包括数据的预处理、挖掘算法的管理、算法库的构建以及数据挖掘模型的可视化。数据挖掘的结果模型用PMML表示,可以实现数据挖掘模型的共享和再利用。接着研究了关联规则挖掘算法并给出了关联规则挖掘算法的一种实现。最后给出了一个B/S结构的基于Web服务的数据挖掘系统原型的实现,并利用该原型系统对某超市的购物篮数据进行了关联规则挖掘,从而证明了本文提出的数据挖掘系统架构具有较高的可伸缩性、可信度和可实施性。
其他文献
自然场景下的文字识别由于文字所处背景复杂,很难准确定位到图像或视频中的字符,字符的定位技术成为解决自然场景下文字识别的重要环节。以自然场景图像中的文字定位与提取作为
网络地理信息系统(WebGIS)是测绘技术与计算机应用技术相结合的产物,使地理信息系统依托计算机网络真真实现了信息共享,并由此衍生出面向社会各行各业的应用,成为当前计算机
在计算机动画模拟领域中,对水动画的模拟是一项困难而又有意义的课题。本文中使用了两种方法对水动画进行模拟。一种是利用求解浅水波方程常用的数值方法,另一种是通过粒子系统
本文对基于GPS&GPRS的车载监控终端硬件设计进行了研究。文章介绍了采用ARM7核的LPC2104的特性;ubloxGPS信号接收机的基本结构、主要功能、接口定义;GPRS模块的开发,针对wavecom
医学数字成像和通信(Digital Imaging and Communication in Medicine,DICOM)是医学图像及有关信息统一格式及交换方法的标准。论文基于对DICOM标准中相关理论的研究,阐述了
空间数据对象除了空间属性(比如位置)之外,还有一些非空间属性(比如对空间数据对象的描述信息)。但是,目前关于海量空间数据聚合查询的国内外研究还是主要局限在纯空间属性层面,因此
软件体系结构作为20世纪90年代国际软件工程领域出现的一个新兴的重要研究方向,已经成为软件工程界的一个研究热点,同时也已发展成为软件工程的一个独立研究分支。软件体系结
设计模式描述了软件设计过程中某一类常见问题的一般性解决方案,它是成功的构架、设计及实施方案,是经验的总结。设计模式使人们更加简单方便地复用成功的设计和体系结构,使
图像是视觉信息的表现形式和存储载体。随着多媒体、计算机、通讯技术及Internet的快速发展,图像的来源越来越广泛,图像数据库成为组织、表达、存储、查询和利用这些海量图像数