模式识别中的样本选择研究及其应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:kfk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技的发展,人们需要处理的信息数据日渐呈现出高维和海量的特点。然而,随之而来的困扰是如何有效地分析和利用这些数据。这是模式识别、数据挖掘、神经网络、机器学习等学科所共同面临的问题。在统计模式识别中,许多分类方法的计算复杂度随着训练集样本个数的增加而快速增长。因此对于较大规模数据的处理常常陷入困难。一个直接有效的解决途径就是在保证学习算法分类性能的前提下,通过样本选择来约简训练样本集。样本选择既可以起到降低算法计算代价,加快学习速度的作用,也可能避免“过拟合”现象的发生,从而提高分类算法的泛化能力。本文针对分类决策与训练样本凸包有关的一类分类器,包括线性支持向量机、非线性支持向量机、最近邻凸包分类器和核最近邻凸包分类器,提出了几种样本选择方法,并通过实验分别对它们的有效性进行了验证。本文首先提出了子类凸包样本选择方法。该方法针对一类训练样本,通过迭代逐一选择距离选择集凸包最远的样本,从而使得选择集凸包尽可能地逼近原凸包。经证明,该方法选择的样本为原训练集凸包边缘点。本文将该样本选择方法分别与线性支持向量机和最近邻凸包分类器相结合,并取得了良好的实验效果。本文将核函数方法与子类凸包样本选择算法相结合,提出了核子类凸包样本选择方法。该方法利用核函数替代子类凸包样本选择算法中的内积运算,从而巧妙的在特征空间中实现了子类凸包样本选择的过程。本文将该样本选择方法分别用于非线性支持向量机和核最近邻凸包分类器的训练集约简。实验结果表明,由该样本选择方法选择的少量样本可以有效地支撑非线性支持向量机和核最近邻凸包分类器分类。本文提出子空间样本选择方法。该样本选择方法同样是一种类内样本选择方法,通过迭代逐一选择那些到已选样本集张成子空间距离最远的样本。经证明,该方法选择的样本不但是原训练集样本凸包的边缘点,而且彼此线性无关。本文将该样本选择方法应用于线性支持向量机。实验表明,该方法选择的样本在保持线性支持向量机较高识别性能的前提下,使得分类器的训练和测试时间明显缩短。本文在子空间样本选择方法的基础上,引入核函数,形成核子空间样本选择方法。首先通过非线性映射将各类别训练样本映射到特征空间,然后在该空间内执行与子空间样本选择方法相同的选样过程。在验证实验中,该方法为非线性支持向量机选择样本。在保持分类器泛化能力的同时,该方法选择样本少,选样速度快,表现出了明显的比较优势。
其他文献
采用SRAP分子标记技术,对国内外70份茄子材料的遗传多样性和群体结构进行了分析。结果表明:21对引物共扩增出375条条带,平均每条引物扩增出17.8条条带,其中多态性条带共72个,多态性
<正>古往今来,我们的社会对教师作为榜样都提出了很高的要求。做一个老师容易,但做一个成功的老师很难。要想成为一个好老师,必须做到以下几个方面。第一,做好老师,要有远大
摘 要:深入实施智慧教育,促进信息技术与教育教学的深度融合,以此为基点培养学生的信息素养是信息技术教学的重要任务。本文从对信息素养的内涵和必要性简析出发,探讨了如何运用智慧校园來培养学生的信息素养。  关键词:智慧校园;信息技术;信息素养  信息素养教育,是一种以培养学生信息意识和信息处理能力为目标的教育,它并不是一种纯粹的技能教育,而是要培养学生具有适应信息社会的知识结构,开发学生终身学习能力、
摘 要:小学英语活动课是小学生学习过程中很重要的成分。英语活动课是强调学生主体地位的一项重要课程,能给学生许多讨论,合作思考的空间。英语活动课是一项有趣的活动体验,对孩子的英语学习有着重大的影响。但活动课中也不缺乏一些问题,需要将其改进,使英语活动课更加的完善。  关键词:小学;英语;活动课;含义;过程;意义;建议  在社会发现的今天,教育发展变得越来越重要。小学教育在孩子学习中是很重要的。在小学
通过综述电磁兼容技术的基础概念,介绍某型号指挥方舱在复杂电磁环境下的电磁兼容技术的应用。解决了将探测目标雷达和各种指挥控制系统及通信设备共用硬件平台的问题。
刘知几于《史通》中对唐代以前的史学予以系统评论,而历史编纂学是其史学评论的主要方面。刘知几的历史编纂学思想,与中国传统史学中的诸多史家一样,具有“二重性”特征。其
通过分析股指期货产生的条件及其功能,指出我国目前推出股指期货的障碍,并提出了相应的对策.
新产品开发是现在工程机械主要的发展背景.现阶段,我国在进行新产品开发时还存在很多的问题.通过对国内外新产 品市场前景进行分析研究,可以将问题的损害性降到最低,引导企业
昌吉州作为天山北坡经济带核心区域以及新疆率先发展的重点地区,其绿色、循环、低碳发展对于新疆生态文明建设具有重要意义。文章基于2014年的数据,运用熵值法对昌吉州及新疆其
以汽车转向系统中的阿克曼原理为出发点,考虑汽车前轮主销定位角度、轮胎弹性对阿克曼原理的影响,计算出转向梯形的主要参数,对转向梯形实际转角差与目标车型转角差进行了比