基于配对约束的核半监督非线性降维算法

来源 :第五届全国信息检索学术会议CCIR2009 | 被引量 : 0次 | 上传用户:xmblyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
降维是在损失较少信息的情况下处理高维图像数据的关键技术,是高维数据预处理的重要步骤。本文研究了基于配对约束和混合核函数的半监督非线性降维方法KS2DR,该方法可有效利用标签和未标签的样本执行半监督学习·基于配对约束形式的领域知识被用于判断当前样例是属于相同类(相似约束)还是不同类(不相似约束)·KS2DR先将样本数据投影成一系列“有用的”特征形式,同时保持原始数据以及定义在投影后的低维特征空间中的相似约束与不相似约束下样本的内部结构特征,使样本在投影空间中容易有效地区分。通过大量的分类任务和数据可视化研究,结果表明,当样本数据的维数被减少到一个较低的水平时,KS2DR的性能表现的更为优越,几乎总是取得较高的分类精确,随着投影维数的不断变化,算法体现出广泛的适应性和良好的学习能力。在相同的测试条件下,KS2DR算法运行花费较少时间,其整体性能甚至优于典型的PCA,KPCA和KFD方法。
其他文献
查询推荐是搜索引擎系统中的一项重要技术,其通过推荐更合适的查询以提高用户的搜索体验。现有方法能够找到直接通过某种属性关联的相似查询,却忽略了具有间接关联的语义相关查
会议
Web论坛文章具有数据量大、信息重复度高的特点,如何快速准确地获取文章主要内容是许多基于论坛应用面临的难题。以往的多文档摘要方法由于没有考虑论坛文章的特殊性,不能有效
通过对搜索引擎的日志进行统计分析,可以了解用户使用搜索引擎的规律,挖掘用户的兴趣信息,从而可以提高网络信息检索技术的性能。搜狗是一个中文搜索引擎,本文对搜狗日志中有密切
会议
本文研究论坛的增量搜集问题。由于在论坛中同一主题通常分布在多个页面上,而传统增量搜集技术的蕈抓取策略通常是基于单个页面,因此这些技术并不适于对论坛增量搜集。本文通过
李晓轩甲辰年九月生,号乡农、止禅,别署禅一堂主人、清水布衣生。现为中国画艺术家联盟主席,中国彩墨画艺术家协会会长,中国画研究创作中心主任,艺网易艺术总监。酷爱国画艺
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的主要研究领域。为更好理解网
会议
每天有大量的信息涌现在论坛上,用户可以通过论坛获知目前国际国内正在发生的一些突发事件。这些突发事件或话题在论坛中并不是显而易见的,它们需要通过人工的总结与归纳。这需
会议
认识他之前,我不知道世界上有如此快乐的人,认识他之后,我不觉得世界上有任何事情可以夺走你、我、他的快乐!他是意大利声名卓越的制鞋师,是技艺超群的艺术家,是全身每一个毛孔都洋溢着快乐的天使!  您没有看错,我也没有写错,是鞋将,不是鞋匠,因为在我眼里Doriamo Maycucci绝不仅仅是一般的制鞋匠,他是制鞋师中的将军,是至高无上的存在。  绝非头脑发昏的小女生,也早过了盲目追星的年龄,此番如此
网络话题层出不穷,往往会引发重大舆情危机,如何快速高效的从海量信息中发现热点是一重大挑战.本文提出了一种基于主题词的网络热点话题发现算法。其基本思想为:首先综合主题词
会议
为部队服务是军队医院永恒的主题,54960部队医院称得上为兵服务的典范。近几年,该部队官兵对这个医院的信任率和满意率均为100%,都超过了全军要求标准。该医院连年被军区、集团军评为医疗