面向高维数据的并行非线性最小二乘分类器研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:greatbear1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来以及云计算等先进数据技术的发展,高维数据处理已经渗透到科研和生活的各个方面,在诸如科学研究、生物医学、网络通信等众多领域起到至关重要的作用。作为经典的数据分析方法之一,传统分类方法在面向高度复杂的高维数据时已捉襟见肘,许多处理低维数据运行良好的分类算法在高维数据中的分类效果亟待提高。因此,如何构建面向于高维数据的有效分类算法成为数据挖掘等领域的热点问题。  本文系统地介绍并分析了几种基本分类算法及相应改进算法的优缺点,同时对高维数据分类的通用特征降维方法进行了总结,讨论了这些方法在应用时的一些局限性。本文结合传统算法的优点,提出了一种适用于高维数据分类的新算法——并行非线性最小二乘法,并在新算法的基础上提出改进的随机版本,最后,基于以上算法的性能评估实验表明新算法具有更好的性能和精确度。本文的主要研究成果可归纳如下:  1、为解决最小二乘法处理高维数据效率低下的问题,结合并行分类方法提出了一种处理高维数据的并行非线性最小二乘分类算法。该方法平均地划分数据维,并行计算局部模型参数,整合后形成全局参数,通过一个迭代优化过程,可以大幅提升参数的性能。  2、在并行非线性最小二乘分类算法的基础上提出改进的随机版本。通过将迭代过程开始时的平均划分数据维变成随机地分割数据,可在时间复杂性基本不变的情况下,进一步提高了并行非线性最小二乘分类算法的性能。  3、完成了新算法的性能评估实验。以最小二乘法作为基准方法,选择共同的高维数据集作为实验样本,对新方法的学习效率和预测性能进行了评估。实验结果表明:本文所提出的新算法能够很好收敛,同时与最小二乘法相比,具有较好的时间优势,并能达到更好的预测精度。尤其是随机版本的新算法,表现出更优的时间优势,此两种方法均可被视为处理高维数据分类的重要候选方法。
其他文献
OCT(Optical Coherence Tomography)成像技术是利用相干光干涉原理对生物组织进行成像,具有实时性好,分辨率高的特点。OCT系统已广泛应用于生物医学成像应用中。本文对基于OC
当前,国内外的许多城市都在推进“泛在城市”、“智慧城市”研究与建设,希望以此为契机带动整个信息产业,乃至促进经济和社会的发展。泛在网中,最为核心的问题是如何确保异构
Ad Hoc网络是一种由移动节点组成的不依赖基础设施的临时多跳网络,由于它具有易部署、分布式等特点,已被广泛应用在很多领域。随着多媒体等业务的发展,对于在Ad Hoc网络中提
基于静息态功能磁共振(resting-state functional magnetic resonance,rs-fMRI)血氧水平依赖(blood oxygenation level dependent,BOLD)信号的脑功能研究已经成为认知神经科学
近年来,关于下一代互联网和物联网的研究成果日渐丰富,新的数据通信和传输方法不断涌现。其中,新的路由协议是新型网络的关键部分,其正确性直接影响着网络的稳定性。然而路由协议
随着经济、社会以及网络技术的发展,如何保障网络上传输的信息的安全性越来越受到人们的重视,信息隐藏技术的研究已成为信息安全领域的焦点。Word2007是办公处理软件的代表产品
目的:精神性疾病是一类广泛影响患者情绪、社交和认知功能的疾病,给患者及家庭带来沉重的生活负担。对精神类疾病的精确诊断、及早干预意义重大。然而,目前对各类精神疾病的
随着计算机网络规模的不断扩大和通信技术的迅速发展,IPv6协议越来越受到关注。IPv6协议拥有超大的地址空间,解决了IP地址匮乏的问题,而且提高了网络吞吐量,可以更方便更好地支持
虚拟实验室能够低成本、方便快捷地实现实验教学,已成为各高校和研究机构实践教学的有效补充。但由于虚拟实验室用户负载的大幅变化,服务器等硬件资源往往按负载峰值数量配置