一种新的基于序贯最小化的并行化支持向量化机

来源 :中山大学 | 被引量 : 0次 | 上传用户:heyjoey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
并行化支持向量机是为了适应在海量数据中进行大规模数据挖掘的需求而产生的数据挖掘技术。在海量数据中进行数据挖掘,目前只有两种相对独立而且有效的方法:在线学习(Online Learning)和并行计算(Parallel Computation)。当前许多在线的算法能不断地对模型进行更新,由于其算法复杂度低而被采用,但是这些方法很容易随着数据分布的变化产生概念偏移,也就是说最近一段数据的重复出现可以改变由历史积累下来的信息甚至颠覆历史,所以并行的方法在解决这个问题上更具优势,它将整个大的数据集作为一个由某个分布抽取得到的整体,不会产生概念偏移。并行计算作为一种分布式计算,它充分利用不同处理单元的计算资源,在同一个时间段内进行单个计算节点所不能处理的海量计算,值得深入研究。   本文在介绍几种并行化的支持向量机的基础上提出一种基于序贯最小化(SequentialMinimal Optimization)的并行化算法。序贯最小化是目前实现支持向量方法的一种快速算法,也是一种标准算法,它的核心部分可以用来解决分类、回归和一类问题。在充分利用序贯最小化SMO的计算效率的基础上,并行化的SMO(NPSMO)利用多个处理单元解决单个处理单元难以完成的大规模数据训练工作。
其他文献
传统的企业专用网不仅租赁费用昂贵、成本高,而且效率低下、维护难度大,使很多企业都难以承受,已难以适应现代企业的需求。IPSec作为一种三层的VPN技术,替代了传统的网络,以
随着信息技术和计算机网络的飞速发展,数字多媒体信息的存储、复制与传播变得十分方便。人们可以毫无限制的拷贝、散布和编辑各种数字媒体信息,从而使原创者的版权和经济利益
时间属性是客观世界事物的内在属性,时态信息处理技术是信息处理技术发展的客观要求,是信息技术研究领域中的重要课题,开展时态信息处理技术的研究与应用是对数据库研究工作
随着计算机和网络技术的发展,在计算机视觉和数据库系统两大研究领域的推动下,图像的信息得到了广泛的应用,基于内容的图像检索技术也成为了现在的研究热点。在传统的图像的
近年来,数据挖掘(data mining)引起了信息产业界的极大关注,其主要原因是现实中存在大量数据,不能被充分使用,另一方面又存在着迫切需要将这些数据转化为有用的信息的需求。概念
学位
随着社会的飞速发展,越来越多的信息交互需要通过互联网来承载。当前,互联网承载的数据类型已从以前的纯文本数据发展为现在的语音、视频、文本等多类型数据了;同时,网络结构类型
近年来,基于人脸图像的生物特征识别研究取得了巨大的发展。同其它的生物特征识别相比,人脸特征具有自然性、方便性和非接触性等优点,使其在安全监控、身份验证、人机交互等
移动Ad Hoc网络由一组带无线收发装置的移动节点组成,它不需要依靠固定基础设施,没有任何中心实体,是多跳、自组织的对等通讯网络。由于其组网灵活,使用方便,因此得到了国际
CPC(Cost-per-click)模式下的“恶意点击”,手段日益广泛、性质日益恶劣,已成为网络中在线广告的顽疾。防恶意点击技术是IT行业中新兴的研究课题。而图形验证码技术是近年来
由于纹理的普遍性和复杂多样性,使人们很难对其进行有效的分析和十分准确的识别,这也促使人们对图像的纹理分析的进一步研究。目前,对图像的纹理分析是国内外的一个热点研究