【摘 要】
:
近年来随着数据量呈指数增长,我们生活在一个拥有大量高维复杂数据的世界中。流形学习是从高维数据中恢复低维流形结构的框架,面对高维复杂的数据流形学习逐渐成为模式识别(如人脸识别、聚类分析)的核心技术之一。目前大多数谱聚类(SC)算法是通过计算数据的拉普拉斯矩阵特征值来划分数据,比如:PCA和ISOMAP。这样传统的降维算法只能处理具有单一流形结构的数据,但是当数据位于或接近多个平滑的低维流形时,都难以
论文部分内容阅读
近年来随着数据量呈指数增长,我们生活在一个拥有大量高维复杂数据的世界中。流形学习是从高维数据中恢复低维流形结构的框架,面对高维复杂的数据流形学习逐渐成为模式识别(如人脸识别、聚类分析)的核心技术之一。目前大多数谱聚类(SC)算法是通过计算数据的拉普拉斯矩阵特征值来划分数据,比如:PCA和ISOMAP。这样传统的降维算法只能处理具有单一流形结构的数据,但是当数据位于或接近多个平滑的低维流形时,都难以描述具有交叉点曲面的真实形状,并导致不正确的聚类。极端学习机(ELM)训练速度快、分类率高,但在实际问题中由于数据具有较高的维数,对数据进行传统维数约减的方法忽略了复杂数据之间的流形信息和小样本问题,会导致ELM在有限训练样本的情况下出现过拟合现象。针对上述问题,本文做出了相关研究,主要成果如下:1)提出了一种全新的多流形聚类算法(Multiple Manifold Clustering Using Tilt path algorithm)。该算法随机选择几个地标点然后检查每个地标点与其他点之间是否存在受曲率约束的路径,证明了最短路径算法缺乏曲率的限制会导致在不同曲面上的点之间存在路径距离,进而解决了交叉流形混合拓扑结构的聚类问题。该算法成功应用到人工合成数据集和真实数据集上,并与其他聚类算法相比取得了很好的聚类准确率。2)提出了一种强制性局部保持投影算法(Force-Locality Preserving Projections,FLPP)。该算法为保持全部样本和局部样本之间的几何结构,将流形信息引入到类间离散度矩阵中,以此来避免样本点重叠和小样本问题,该算法有效地提高了极端学习机(extreme learning machine,ELM)的泛化能力和分类准确率。
其他文献
β-胡萝卜素(β—Carotont)是重要的维生素A原,可在体内转化为维生素A(VitA),此外,β—C也是重要的膳食成份之一,它除了具有VitA活性外,尚有增强免疫功能、抗氧化、光保护、
尽管世界各国在证券立法上一般都强调惩处内幕交易 ,但在理论界 ,对这一问题的看法仍是各执一词。我国对内幕交易犯罪宽泛且严厉的处罚措施 ,与证券发达的国家相比 ,在处罚力
<正> 他如今生活在一个大城市里。由于在城市里生活了多年,他的外貌和气质已经与这个城市里的人没有什么两样。他喜爱笔墨,迷恋书籍和文字,这又为他平添了满脸的书卷气;他过
本文通过对北京市T街道社区志愿服务的组织与运行的深入调查,发现我国社区志愿服务存在"行政化"与"去行政化"共存的两难困境。其根源在于制约社区志愿服务发展的三重矛盾。第
通过45,50,55和60℃等温DSC固化研究了成分(过氧化氢、MEKP单体和二聚体)比例不同的过氧化甲乙酮(MEKP)对不饱和聚酯树脂(UP)固化诱导期、峰值时间和固化率的影响,并讨论了固
通过和普通导体线圈比较,从超导线圈内磁通量保持不变的性质出发,讨论了不同情况下超导线圈中感应电流的大小、方向和持续时间等方面的特点.
基于金川炼镍生产工艺及炉型特点,开发了卧式侧吹转炉溅渣护炉技术。溅渣模式为一个转炉化渣、另一个转炉溅渣,溅渣气源为空气,调渣剂选用轻烧镁球。工业实践表明,溅渣期间,
1月10日,国家邮政局发行了《马踏飞燕》普通邮资明信片,图案中那座青铜制的骏马相信不少邮人已经很熟悉了,这座1969年10月出土于甘肃武威一座东汉灵帝时期的张姓将军墓的铜马俑,
<正>在漫长的人类发展史上,自母系氏族社会之后,古代中国就再也没有提供共女子们展示风采的社会舞台,其社会角色被定位为"第二性",女子们成了男人的附庸。回顾漫长的社会发展
针对金川二矿区开采现状,在原有开采方案的基础上提出了一种新的开采方案,即矿体中部一个盘区有序滞后一个分段回采,并同步割帮处理滞后盘区的开采方案。在地质条件、进路结