【摘 要】
:
现实问题中的数据通常是高维的,其中存在大量的不相关和冗余的特征,这给传统的学习算法带来了巨大的挑战。特征选择就是在这种情况下应运而生,是一种有效的降维方法。特征选
论文部分内容阅读
现实问题中的数据通常是高维的,其中存在大量的不相关和冗余的特征,这给传统的学习算法带来了巨大的挑战。特征选择就是在这种情况下应运而生,是一种有效的降维方法。特征选择旨在从数据的原始特征中选择一个最优特征子集,是机器学习和数据挖掘领域中一个重要的研究课题,被广泛应用于实际问题中。与此同时,许多实际问题中数据存在多个视角,多视角学习是机器学习中的一个热点问题。一般情况下,合理地运用蕴含于多视角数据中的互补信息和关系可以大大提升学习效果。另一方面,随着信息技术的发展,数据朝着大规模的方向发展,但是数据的标记往往难以获取。本文主要研究怎样运用不同视角数据之间的关系帮助选择最大相关最小冗余的特征子集,我们提出一种基于多视角的半监督特征选择方法,探索蕴含于多视角数据中的互补信息和关系以及每个视角中不同特征之间的冗余关系,并利用少量标记数据蕴含的信息协同未标记数据同时进行特征选择和聚类学习,用于处理“部分标记”的多视角数据。本文的主要贡献有:(1)本文将多视角特征选择与半监督学习结合在一起,解决多视角学习中“部分标记”的特征选择问题;(2)在多视角特征选择中考虑了每个视角中不同特征之间的冗余关系;(3)5个多视角数据集上的实验结果表明了我们的方法能够获得较好的特征选择效果及聚类效果。
其他文献
近年来,脑损伤、中风等疾病导致的病人运动障碍、生理残疾等情况越来越多,严重影响了病人的正常生活,给病人及其家庭带来了极大的负担。医学研究表明,手部康复训练对于治疗手
医学图像多相分割与多器官的三维重建在计算机辅助诊断及虚拟手术中有着重要的应用,但由于医学图像本身的复杂性和多样性,经典的图像分割技术无法满足实际需求。本文对平面上
网络上的信息增长和更新速度越来越快,同时存在大量重复的垃圾信息,这些都给人们获取有效信息带来了不便。传统搜索引擎一方面只能返回大量相关网页或文档,另一方面,基于关键
肝脏作为人体内极为重要的解毒器官,近些年来由于生活质量的提高,大量饮酒或饮食不当导致的脂肪肝等病症越来越多,一旦没有得到及时治疗很容易发展成为肝脏肿瘤,所以针对肝部
随着社会科技水平不断提高,身份鉴别的准确性、实用性、安全性等方面受到了人们越来越多的关注,传统的身份识别方法已不满足现实需求。由此,大量学者们一直在致力于寻求一种
基于场景的软件需求建模技术是软件需求工程中被证明最有效和被广泛采用的建模技术之一,但场景建模方法中软件需求描述模糊、不一致问题影响了其使用效果,场景可视化描述可显
半监督学习是机器学习中一个重要的研究领域。半监督学习通过使用少量标记数据并辅助以大量未标记数据进行学习,在尽可能减少人工标注代价的前提下尝试提高学习器的性能。基
本文主要研究交通流量的检测。在目前的各方法中,视频检测是研究得最多的一种方法。视频检测是建立在机器视觉的基础之上的。机器视觉是在图像处理的基础上发展起来的新兴学
随着信息科学技术的快速发展,人脸识别技术在信息安全领域承担着越来越重要的作用,应用于安全监控、电子商务、安全防务等领域的前景越发广阔。但实际应用中易受光照、遮挡、姿