独立成分分析与支持向量机在大规模学习问题中的应用

来源 :华东理工大学 | 被引量 : 0次 | 上传用户：changjian200910

【摘要】

：

支持向量机(SupportVectorMachine，SVM)是在统计学习理论的基础上发展起来的一种新的机器学习方法，它在小样本问题中表现出很多良好性能。但如果遇到问题规模较大时，如样本维数

【作者】

：

李杰

【机构】

：

华东理工大学

【出处】

：

华东理工大学

【发表日期】

：

2006年期

【关键词】

：

支持向量机独立成分分析大规模学习机器嗅觉气味识别机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

支持向量机(SupportVectorMachine，SVM)是在统计学习理论的基础上发展起来的一种新的机器学习方法，它在小样本问题中表现出很多良好性能。但如果遇到问题规模较大时，如样本维数很高，训练样本数很大，许多经典模式识别方法都会出现学习速度慢，占用内存空间大等问题，如神经网络等方法还会出现陷入局部极小的问题。由于SVM识别过程要对样本在高维空间进行映射，数据规模大引起的问题更为严重，采取一些优化算法显得尤为重要。本文主要采取两种方法解决这一问题：一是对数据样本本身进行处理，采取独立成分分析(IndependentComponentAnalysis，ICA)进行降维；二是对支持向量机算法本身进行改进，使其训练速度进一步提升。 ICA的主要目的是寻找一种适当的变换，使变换后得到的信号尽可能的相互独立，过这种变换可以找出数据之间隐含的结构关系。作为主成分分析和因子分析的的一个扩展，在某些情况下作为一个更加有效的工具，ICA可以找出主成分分析和因子分析所不能发掘出的隐含因素，从而使降维后的数据更加有代表性，对分类的支持更好。特别的，本文将对非线性版本的独立成分分析做出尝试，使特征提取更加符合样本自身情况。支持向量机算法中，主要对序列最小优化(SequentialMinimalOptimization，SMO)方法进行改进，采取更准确的二阶信息对训练集进一步优化，以减少训练、收敛时间。最后，将上述算法应用于机器嗅觉气味识别系统中。实验结果表明，本文方法有效解决了机器嗅觉的气味识别问题，并取得较好的学习速度和分类精度。

其他文献

笔式交互系统的最终用户开发方法

随着计算环境与交互设备的发展，笔式用户界面以其自然的交互特征和便携轻巧的物理特性迅速成为了新一代用户界面研究的热点。然而基于笔交互的软件系统是一个用户个性化需求突

学位

笔式用户界面人机交互系统最终用户开发领域模型任务描述语言码自动生成

面向高等级安全操作系统的访问监控器设计、实现及其性能优化

高等级安全操作系统在信息安全领域中具有基础性地位，访问验证保护级安全操作系统是GB17859和GBT20272定义的最高等级的安全操作系统。微内核架构很好地满足了高等级安全操作

学位

安全操作系统访问监控器设计原则性能优化

基于选举算法的入侵容忍Web服务系统研究与设计

本文针对传统Web服务体系架构的缺陷，结合入侵容忍的思想，利用冗余与多样性等技术，设计了一个基于选举算法的多层次、多代理的入侵容忍Web服务体系架构，并在此架构的基础上提出了

学位

网络服务系统入侵容忍选举算法网络安全

基于分级角色的访问控制及XML Schema实现

本论文设计并实现了一个完整的角色访问控制模型，并在实际系统中应用。与传统的访问控制相比更简单、安全且与平台无关。在ANSI的基于角色的访问控制模型的基础上，提出了角

学位

访问控制模型等级角色矩阵公有权限模型集合

软件功能规模度量（FSM）方法的研究

软件功能规模度量(Functionalsizemeasurement，FSM)方法是从用户的角度按功能来表达开发的工作产品，它通过确定功能域的数量来导出软件的规模，它是独立于所采用的技术或工具的。

学位

FSM方法软件度量方法ISO标准映射规则COSMIC-FFP方法数据操纵数据复杂度软件规模

基于角色概念的学习本体构建及其在e-Learning中的应用

Web已经成为网络信息的主要交互平台，是人们获取知识的主要来源。但是，由于Web页面的无结构性、超链接的自由无序性、以及Web内容的海量性、多样性和动态变化性，使得人们从Web上

学位

个性化学习本体构建角色概念网络信息

网络入侵检测与行为关联分析技术研究

Internet目前面临严峻的安全威胁，网络入侵检测和关联分析技术能有效地发现并理解这些威胁，构成了动态网络安全模型的关键环节，也成为目前网络安全领域的热点研究问题。本文

学位

网络入侵检测报警关联知识表示规划识别关联分析蜜罐蜜网僵尸网络

基于Struts的国家岩矿化石标本资源管理系统

国家岩矿化石标本资源管理系统是科技部国家自然科技资源共享平台项目的子项目。该项目是将分散在全国相关单位和专业研究人员的具有重要科学价值的珍贵岩矿化石标本,以共享

学位

国家岩矿化石标本资源平台资源号资源归类E平台源数据主键

离散曲面的多分辨率编辑与形变

曲面编辑一直是人们研究的热点问题，特别是在计算机图形学、虚拟仿真、可视化、三维动画等领域有广泛的应用背景。本文讨论了曲面的编辑和形变的理论与方法，包括曲面的表示方法

学位

计算机辅助几何设计曲面造型曲面编辑曲面形变计算机动画网格分割特征造型

基于生物视觉编码的自然图像模式识别和分类的研究与实现

本文首先论述了生物在识别物体的过程中需要经过很多个阶段的信息编码和提取过程，并将高度冗余的象素数据转变为特征信息再进行识别的特征对结合生物视觉编码机制的图像模式识

学位

自然图像模式识别生物视觉编码机制

独立成分分析与支持向量机在大规模学习问题中的应用

与本文相关的学术论文