基于核诱导距离度量的鲁棒典型相关分析研究与应用

来源 :南京航空航天大学 | 被引量 : 1次 | 上传用户:plbplbplb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据降维是模式识别领域中一个重要环节,其基本任务是从高维数据中提取稳定有效的特征以满足后续学习任务。典型相关分析作为一种经典的多视图数据降维方法,其目的是研究同一对象两组变量间线性相关性进行特征提取,已经在模式识别领域得到广泛的关注和应用,然而,由于真实世界中数据的多样性,导致CCA如下典型缺陷:(1)作为一种线性算法,其不能很好地直接应用于非线性问题;(2)真实世界中数据难免带有噪声,所采用的欧氏距离度量导致了其本质上的非鲁棒性。近年来,研究人员陆续提出一些改进的CCA算法,然而,大多数算法只解决了CCA的非线性缺陷,仍旧缺乏对鲁棒性的研究。因此,本文针对典型相关分析鲁棒性问题做了深入研究,主要内容和研究成果如下:首先提出一种新的基于核诱导距离的鲁棒典型相关分析(KI-CCA),该方法采用径向基核函数诱导的鲁棒距离度量,不仅克服了CCA非鲁棒的不足,而且使1)现有的基于最大相关熵的鲁棒PCA成为特例;2)CCA具有非线性相关分析的能力。一方面由于核的多样性,使得KI-CCA也具有多样性,从而使其成为一般性的分析算法。另一方面,同CCA刻画问题相似使其解可归结为广义特征值问题。在人工数据集、多特征手写体数据集(MFD)和人脸数据集上(yale,AR,ORL)的实验验证了该方法的有效性。其次根据鲁棒化方式不同,对鲁棒典型相关分析进行了分类,具体分为直接鲁棒典型相关分析与间接鲁棒典型相关分析。KI-CCA算法即属于一类直接鲁棒典型相关分析。本文进一步提出一种间接鲁棒典型相关分析框架,该框架采用一种新的鲁棒主成分分析,即KI-PCA,作为数据预处理方法。该框架鲁棒的本质在于用鲁棒的数据预处理方法发现数据中的野值点,为CCA后续任务提供鲁棒性保证。最后深入研究本文中两种不同鲁棒方式的典型相关分析,从理论和实验上比较二者的性能。根据大量数据集的实验结果总结出结论,为后续的研究提供有意义的指导。
其他文献
当前,美国、欧洲及日本等发达国家均对数字信息传输技术进行了深入的研究,我国对数字卫星通信、数字有线电视和数字地面电视的信源编码及标准也展开了研究。针对通信中传输复
近年来,随着电子信息,通信以及计算机科学的快速发展,脑电信号的处理所需要的理论和技术也越来越完善,因此,对脑机接口(Brain Computer Interface,BCI)的研究已经开始成为热点。获取
网络管理员的工作是很复杂的,只要网络出现异常,网络管理员就会想救火队员一样忙,他们不仅要负责安装、维护HUB、交换机、路由器、防火墙、IDS(IPS),而且要确保这些部件全部都能
随着多媒体内容的急剧增长、各种不同终端设备的出现以及异构网络的动态特性,用户对多媒体体验的要求越来越高,他们希望能够使用各种设备随时随地享受更好的多媒体服务,这种范式
无线传感器网络(Wireless Sensor Networks,简称WSNs)是一种由大量廉价的微型传感器节点通过自组织形式组成的智能网络系统,在军事和民用等领域有着十分广阔的应用前景。目标
在科技飞速发展的现代社会,服务器系统的安装数量呈直线上升趋势,服务器管理员的工作也日趋繁重,为了减轻管理员的工作负担并且丛整体提高服务器的了用性、可靠性方面来考虑,
高等职业教育作为高等教育的一个重要组成部分,其主要目的是培养技能型人才,提高学生实际工作能力。为了更好地科学有效地评价高职院校的教学质量,教师要注重对学生实践能力的培
随着RFID、无线网络等物联网技术的快速发展,产生了大量的移动对象数据。移动对象一般都具有多维属性和时空特征,移动对象之间进行通信形成了移动对象网络。如何处理和有效利
可比较语料库是自然语言处理领域中非常有价值的资源,但是,目前并没有足够规模的可利用的公共可比较语料库,构建大规模中英文可比较语料库有理论价值和应用价值。本文提出了
随着语义Web的迅速发展,本体的数量也不断增加。本体异构是阻碍本体重用和共享的障碍,而解决本体异构最有效的方法是本体映射技术。因此,本文将着重对此进行研究。首先,论文