【摘 要】
:
维数约减是处理多维数据的一个重要步骤,是机器学习中的一个重要研究课题,尤其是非线性维数约减技术已经成为机器学习中的一个研究热点。本文针对非线性维数约减算法中的若干
论文部分内容阅读
维数约减是处理多维数据的一个重要步骤,是机器学习中的一个重要研究课题,尤其是非线性维数约减技术已经成为机器学习中的一个研究热点。本文针对非线性维数约减算法中的若干关键问题进行了研究。首先,分析和比较了基于应力函数的评价模型、基于剩余方差的评价模型和基于DY-DX表示法的评价模型,提出了一种基于距离比例方差的评价模型。实验结果表明,利用该模型不但可以评判同一算法在不同参数下的映射效果,而且可以比较不同算法之间的嵌入质量。同时还讨论了如何利用应力函数、剩余方差和距离比例方差来确定邻域参数和低维空间的维数。其次,研究了增量式非线性维数约减算法问题,通过改进增量式ISOMAP算法得到了基于距离保持的增量式算法,提出了基于拓朴保持的增量式算法和基于k近邻投影的增量式算法,这三种算法都可以较为中肯地将训练集之外的样本映射到低维空间中。理论分析和实验结果表明,基于距离保持的增量式算法具有较好的映射质量,基于拓朴保持的增量式算法具有较高的效率,但它们都只是对ISOMAP算法的扩展。而基于k近邻投影的增量式算法同时具有较好的映射质量和较高的计算效率,而且可以作为任一种非线性维数约减算法的扩展。对于含噪声的数据,由于新样本的低维嵌入与训练集的低维坐标无关,基于拓朴保持的增量式算法对噪声不太敏感。而其他两种算法只要在映射训练样本时较好地处理了噪声,就可以忽略噪声的影响。最后,本文讨论了非线性维数约减算法在分类和聚类中的应用。在指纹分类和文本分类中的实验结果表明,通过结合非线性维数约减算法和分类技术,在保证分类精度的前提下,极大地提高了分类算法的执行效率,降低了分类算法的空间需求。对聚类算法的实验结果表明,基于非线性维数约减的聚类算法可以发现任意形状的类,聚类质量明显优于K-均值算法的聚类结果。
其他文献
在面向服务的架构中,如何根据系统资源环境的变化以及构件的功能和实时性等QoS属性动态组合已有的功能构件以满足应用需求,成为当前此领域的一个研究热点。由于采用非形式化(
随着虚拟现实技术的日趋完善和在设计领域的广泛运用,基于产品虚拟原型的设计思想和方法得到越来越广泛的认同。虚拟原型是根据产品设计信息或产品概念描述产生的在功能、行为
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
为用户提供强大易用的造型工具,满足他们创造复杂几何形体的需要一直是计算机图形学界所致力追求的目标之一。现有商业造型系统的复杂性使得它们的使用都局限于一些专业人员
先秦儒家以人为社会管理的中心,以分、和为两种必要的社会管理方式,以礼、乐为社会管理的激励和教化机制,体现了社会管理中的人文关怀精神,可以为我们深化行政管理体制改革和推进
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
模式识别是一门以应用数学为理论基础,利用计算机应用技术,解决实际分类及识别问题的学问。统计和微分几何规范理论和技术在模式识别中有着广泛的应用,尤其是在形状分析以及混合
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
基于政策工具视角,采用内容分析法对民国时期政府管理国立大学政策的量化研究显示,民国时期政府管理国立大学的各类政策工具使用不均,以命令性工具为主导,但政策涉及的管理要
虚张声势是扑克玩家秘笈里面最古老的一种手段,不过在自然界中动物们也能将此运用自如.瑞典斯德哥尔摩大学的动物专家说,孔雀蝴蝶是鸟类最爱吃的一种美味,它们经常先一动不动