面向层次结构数据的特征选择方法

来源 :天津大学 | 被引量 : 0次 | 上传用户:RK0707
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择可有效地加快学习过程、提高模型的泛化能力和学习精度,因此,特征选择已经成为了机器学习任务中一个重要的数据预处理过程。近年来,特征选择方法已取得了长足进展,其研究主要聚焦于扁平化数据,即将所有的数据等同看待,不考虑数据间的结构关系。但是,大数据时代不仅带来了数据样本数量、特征维度及类别种类的快速增长,而且数据间也往往蕴含着丰富的层次结构关系。如何充分挖掘和利用大数据的这些层次结构信息来进行特征选择是机器学习和数据挖掘的重要挑战。因此,本文聚焦于面向层次结构数据的特征选择方法研究,包括以下三个方面的研究内容:(1)面向特征层次结构的自适应邻域粗糙集特征选择:针对基于邻域粗糙集的特征选择方法中邻域大小固定不变的问题,通过利用正态分布3σ统计规则的多层次置信度所描述的数据精度自适应地定义邻域大小,提出了基于特征多层次置信度的自适应邻域粗糙集模型,同时通过权衡测试代价和误分类代价设计了一种面向特征层次结构的自适应邻域粗糙集特征选择快速回溯算法。(2)面向类别层次结构的模糊粗糙集特征选择:针对基于模糊粗糙集的特征选择方法忽略类别间层次结构关系的问题,提出了面向类别层次结构的模糊粗糙集计算模型,用于计算具有类别层次结构数据的上下近似。模型分别考虑了类别层次结构的包容关系及兄弟关系,并设计了相应的特征选择方法,有效地减少了经典模糊粗糙集异类样本的搜索范围。(3)面向分类任务层次结构的递归正则化特征选择:针对目前多数特征选择方法忽略分类任务的层次结构,选择一个特征子集来区分所有类别的缺陷,通过引入分治法将层次分类任务根据层次关系分而治之,提出了面向分类任务层次结构的递归正则化特征选择方法。通过引入分类任务间的父子关系、兄弟关系、家庭关系来优化分类任务层次中各子任务所选特征,进而完成特征选择。所提出的三种方法验证了挖掘数据层次结构是提高大数据分类任务中特征选择效果的有效手段。
其他文献
集合[(?)]={0,1,2,...,n}上的一个递增树(在随机过程领域通常称为递归树)是指顶点集为[(?)]的一个有根标号树,满足从根到叶子的任何一条路径的标号是递增的.递增树在组合学和随机过程领域均是非常重要的研究对象,具有丰富的研究成果.这篇学位论文主要研究递增树以及高维递增树的组合性质.论文分为四个章节.第1章介绍了递增树领域的基本概念和背景,并介绍了后续章节需要用到的相关知识和结果.第2
随着大数据时代的来临,现实中遇到的问题越来越复杂,如何建立更合适的数学模型来解决日益繁杂的实际问题成为近年来的一个热点。最近,作为矩阵的高维推广,张量或称为超矩阵逐渐受到大家关注,成为一个用于表征复杂数据的有效工具。使用向量和矩阵作为变量已经不满足一些实际问题的建模需求,需要以张量为变量进行建模。基于此,本文对张量空间上的优化问题进行若干研究,具体内容如下:首先,引入一类张量收缩积,它是张量与向量
近几十年来,具有时滞的分布参数系统的镇定与谱分析成为国际上的研究的热点和难点问题.本论文主要以一维和高维的时滞控制系统以及时滞的Timoshenko梁系统为对象,研究了时滞控制系统的反馈控制器设计和时滞Timoshenko梁系统的谱分析与解展开.具体内容如下:1.考虑了内部具有差分型时滞控制的一维Schr¨odinger方程的一致镇定问题.不同于已有的控制器设计方法,我们提出了一类新的反馈控制器设
本学位论文主要研究带有质量约束的非线性Schr(?)dinger方程:其中N≥1,f∈C(R,R),m>0是给定的常数,μ∈R作为Lagrange乘子出现.在第一章中,我们简要介绍问题的研究背景和研究现状,并陈述本文的主要结果.在第二章中,我们关心质量次临界情形.在一般质量次临界条件下,我们证明当N≥4时存在非径向对称解;而当N=4或者N≥6时,我们证得多个(有时是无穷多个)非径向对称解的存在性.
折纸是一门中国的传统艺术,其能够将平面材料通过折叠转换成三维结构。曲线折痕折纸是一种特殊类型的折纸,其使用曲线折痕图案通过非刚性折叠使平面材料具有不同的三维结构。近年来,由于其特殊的结构以及力学性能,曲痕折纸在工程和建筑领域中也有广泛的应用。本文通过考虑材料弹性弯曲能量响应和折纸可展性约束之间的相互作用,得到了一系列曲痕折纸图案,并且系统性的研究了弹性弯曲曲痕折纸的设计和应用。首先,本文通过将大弹
本文研究了非线性偏微分方程的分支理论及其应用.主要包含两方面:一是以动力系统,Conley指标理论为工具研究局部半流与非线性发展方程的全局动态分支理论及其应用;二是以变分方法,静态分支理论为工具研究耦合非线性Schr(?)dinger方程组的正解的性质和结构.在全局动态分支理论及其应用方面,我们首先从不变集分支的角度对完备度量空间上的局部半流建立了两个新的全局动态分支定理.这两个定理的条件易验证且
本文研究了由G布朗运动驱动的几类随机微分方程分布性质:包括与维数无关的Harnack和推移Harnack不等式及其应用;可加泛函的路径无关性的充要条件;泛函型随机微分方程的保序性.全文共分如下六个部分.在第一部分,我们概述了本文的研究背景并回顾了与维数无关的Harnack不等式以及G期望、G-布朗运动和G-Girsanov变换的基础知识.在第二部分,我们建立了可加非退化噪声情形下由G布朗运动驱动的
本文主要研究了非线性色散方程的孤立波解的稳定性理论,适定性和散射性及一类双流体力学方程的长时间行为.全文共分为五章.第一章为综述,共分为五小节.第一节为本文的研究背景和研究进展.第二,三,四,五节分别给出了本文中研究的模型的背景和研究进展,以及所得到的主要结论.第二章研究广义Boussinesq方程孤立波解的不稳定性.广义Boussinesq方程写为(?)(t,x)∈ R × R,其中0
微波光子学技术是融合了微波技术和光子学优势的新兴技术,它旨在利用光学技术的高速率、大带宽、低损耗及抗电磁干扰等固有优势,解决传统微波技术(例如高速率波形信号的产生等)所面临的带宽及速率瓶颈等问题。其中以光电振荡器(OEO)为代表的光生微波技术突破了传统微波源的相位噪声的极限,成为了国际研究热点。本文针对此热点,围绕着基于OEO的微波波形产生技术及角速度测量技术两方面展开了研究:一方面探索新型的微波
本文针对光纤光栅(Fiber Bragg Grating,简写为FBG)传感技术的工程应用需求,开展了特殊环境下FBG传感相关技术与高速解调方法的研究。提出了一种基于光延时微波实时相位检测(optical true time delay microwave phase detection,简写为OTTD-MPD)的FBG高速、高分辨率解调方法,将微波光子学中的实时相位检测方法应用于FBG解调;针对