【摘 要】
:
特征选择作为维数约减领域的一个重要分支,对增加机器学习结果的精确度和提高计算效率有着显著的作用。虽然特征选择算法已在监督条件下被广泛研究,然而在非监督条件下,由于
论文部分内容阅读
特征选择作为维数约减领域的一个重要分支,对增加机器学习结果的精确度和提高计算效率有着显著的作用。虽然特征选择算法已在监督条件下被广泛研究,然而在非监督条件下,由于缺少类别信息而使这项任务显得犹为困难。目前大多数非监督特征选择算法的思想都旨在通过消除噪声特征和冗余特征这种间接手段而获得有益特征的目的,但噪声和冗余并不总是能被算法同时消除。本文对特征选择思想做出了重新的解读,认为采用直接选择有益特征的手段不仅自然地可以同时消除冗余和噪声,而且能够显式地对所选特征之间的相互关系进行建模,概念上也更为明确。基于这种思想,本文假设整个特征空间的信息可以通过可互补的特征子集表达出来,进而试图通过一种基于特征间合作度的非监督特征选择过滤器方法以选择出其中一个互补特征子集。通过定义合作度的概念,本文首先对特征之间的相互关系进行描述,并基于此概念区分出互补特征。接着一种基于合作度概念且借助了层次聚类思想的算法框架在文章中被提出,试图选择出一组相互间合作度最大且满足模数要求的特征子集,并以此作为一组可互补的特征子集。本文在随后的篇幅中也给出了关于此算法对抑制引入噪声和冗余的分析,从而在理论上说明了该算法从本质上与消除噪声和冗余特征的思想在根本上是一致的。在对比实验中,该算法与其它主流非监督特征选择方法的效果优劣在九个不同的数据集上加以评估,并从结果中证实了本算法的有效性。最后,文章在总结了全文的同时也给出了该算法可能的改进方向,以及一些可能被进一步加以研究的新课题。
其他文献
随着计算机和网络技术的迅速发展,日趋严重的计算机犯罪给个人、企业、甚至社会的安定和稳定都造成了巨大的影响。计算机取证技术在这种背景中应运而生,并逐渐成为打击高科技犯
数据库系统和信息检索系统在处理数据的方法上有很大的差别,数据库系统通过复杂的查询语言搜索结构化数据,其结果集完整精确;信息检索系统通过关键字搜索非结构化数据,其结果集通
游戏中智能的设计与构建一直是人工智能研究中的热门领域。游戏中,人工智能不仅要模仿人的智能,还需要拥有达到设计者为了满足玩家需求所设定的目的的能力。通过对游戏信息的收
鉴于当前餐饮业面临的物价和人力成本上涨,利润越来越薄,规模难以维持等严峻的市场压力,各种点菜系统开始出现。已有的点菜系统一般由服务员代替顾客完成在点菜机上的操作,忽略了
随着计算机视觉技术和图像处理技术的迅猛发展,视频监控技术在各个领域中的应用越来越广泛。视频监控系统就是利用摄像机等电子设备来捕获视频序列,然后使用计算机视觉技术和图
随着两化融合的快速推进,信息系统逐渐成为国家发展、社会生产以及个人生活中不可或缺的基础设施。信息系统给人类提供巨大便利的同时,面临着黑客、木马、隐通道、社会工程攻
无线设备及业务迅猛增长和频谱资源日趋耗竭的矛盾越来越突出,如何让有限的频谱继续满足人们日益增长的带宽需求成了无线通信领域急需解决的问题。认知无线电技术通过感知并
EOC是以太网信号在同轴电缆上的一种传输技术,由于其无需重新布线,高速的以太网传输能力,较强的抗干扰能力,以及能实现基于IP的各种业务,如高速数据业务,使得其在HFC各方案中
无线传感器网络是一种新型的无基础设施的无线网络,因其广阔的应用前景,引起了国内外学术界和工业界的高度重视,成为目前研究的热点之一。无线传感器网络路由协议是无线传感
入侵检测系统(IDS)已成为网络安全防御体系中的重要组成部分。然而,目前大规模网IDS会实时产生大量琐碎的警报数据,其中普遍存在着冗余的、不正确的警报。这些数量大、质量低