【摘 要】
:
数据深度是表征高维数据空间中点与分布或数据云团接近程度的统计量,它为高维数据的排序提供了一个新的方向,已经成功用于稳健估计、数据判别分析等诸多领域。针对凸深度以及向量深度无法有效处理非凸数据和张量型数据的局限性,本文主要完成三个方面的工作:首先,针对深度的凸性问题,把数据深度扩展到再生核Hilbert空间(RKHS),以构建具有自适应分布(数据形状)的深度函数。主要包括:经典数据深度向RKHS的扩
论文部分内容阅读
数据深度是表征高维数据空间中点与分布或数据云团接近程度的统计量,它为高维数据的排序提供了一个新的方向,已经成功用于稳健估计、数据判别分析等诸多领域。针对凸深度以及向量深度无法有效处理非凸数据和张量型数据的局限性,本文主要完成三个方面的工作:首先,针对深度的凸性问题,把数据深度扩展到再生核Hilbert空间(RKHS),以构建具有自适应分布(数据形状)的深度函数。主要包括:经典数据深度向RKHS的扩展。以空间秩深度和L2深度为例,探讨了核映射深度的性质。针对非可直接扩展的数据深度,以马氏深度为例展示了此类数据深度扩展的过程,为其它数据深度的扩展提供了参考的依据;定义了一个新的广义深度函数:最小球深度。它不仅思想简单,计算方便,且对数据的结构有更优的解构能力。其次,针对张量型数据,以投影深度为例,研究了数据深度在张量空间的扩展。主要完成了如下两项工作:针对投影深度计算比较困难的问题,首先重新定义投影深度为Rayleigh投影深度,把投影深度的计算归结为一个Rayleigh商问题,大大简化了计算量;以二阶张量为例,定义了张量型投影深度,讨论了其主要性质,给出了相应的算法和数值结果。同时,本文把这些结论推广到更高阶的张量空间。结果表明:对于本质为张量型的数据,张量型投影深度具有更好的深度解析能力,即使对于本质为向量的数据,张量型数据深度的结果与向量数据深度的结果没有显著性差异,但却可以避免小样本问题。再次,针对支撑向量机分类问题,提出了基于核映射深度的三个应用。主要完成了两项工作:通过对支撑向量机目标函数中的松弛因子进行核映射深度加权,以针对性地弱化了这些点对分类结果的影响,使得支撑向量机更具有鲁棒性;通过利用核映射深度构建比深,提出了一个估计潜在支撑向量的方法。不仅可以除去大量的计算冗余样本,而且通过修正核和获得的边界信息可提高支撑向量机的分类性能。
其他文献
建筑设计在贯穿整个建筑工程的建设过程中,前期设计的科学与否,会直接影响其建筑成品质量,因此必须对建筑设计进行严格管理。文章从阐述建筑设计管理要点入手,介绍建筑设计中如何运用科学理论,有效分析建筑工程中遇到的实际问题。进一步分析了建筑设计管理中的相关问题存在,最后提出了加强建筑设计管理的若干措施。
本文对当前金属高压熔化规律研究中所涉及的物态方程、熔化判据、熔化区内材料的强度、熔化机制和实验数据分析处理等问题进行了相对系统的研究:1、Anderson所提出的等效Grüneisen系数在地球物理学和铁的高压熔化线的相关计算上得到了应用,并取得了良好的效果。根据Anderson所提出的等效Grüneisen系数的概念,本文在三项式物态方程基础上,对等效Grüneisen方程进行了推导。以等效Gr
在企业已进入破产程序的诚信经营者启动个人债务清理程序中,可指定企业破产案件的管理人担任个人债务清理案件的管理人,以发挥其熟悉案情的优势。债务清理程序应注重吸收利用执行成果和措施,同时有效弥补执行程序查找财产的不足,实现对债务人诚信度的有效甄别,尽力促成免除债务的法律效果,彻底破解执行难困局。现阶段,应协调争取金融监管部门支持,指导金融机构解决投票难题,或建议金融机构将涉及个人债务人的不良资产打包出
数字媒体一直以来都是饱受争议的艺术表达形式,自起始时期勉强以模仿手段再现其他文艺形式的内容作为存在形式,至今经过长久的沉淀才终于具备了其在创作方面的独一无二的优势途径(计算机数字技术)以及表现方面的难以衡量的可能性(能够打破甚至超越理性)。一些优秀的电子游戏作品所呈现的虚拟世界的完善程度较从前来说已是极度的细致入微,而故事主题互动吸引力受到了冲击,玩家实现想象力的途径得到了全新的定义,其游戏体验出
当前机器人产业发展迅速,机器人已应用到制造业、医疗、军事等领域。随着柔性机器人出现,如何提高机器人仿生性和柔顺性成为研究的关键问题。气动肌肉驱动器因其清洁、轻便、柔顺、仿生等特性被广泛应用于柔性机器人中,但气动肌肉驱动器具有的强非线性和不确定性导致其控制困难。本文针对气动肌肉关节,采用自适应反步控制算法提高关节轨迹追踪精度。首先,建立了气动肌肉关节的二阶微分模型。气动肌肉理论模型与实际关节模型偏差
搭建20kW超临界二氧化碳涡轮发电试验系统,开展涡轮发电机轴系临界转速数值仿真研究,对比分析空心轴与实心轴的前4阶临界转速与振型,并计算涡轮的前4阶模态频率。开展转速与负载对轴系振动特性影响的试验研究,采用频谱图分析转速0 r/min~48000 r/min、负载0 kW~20 kW下涡轮端与自由端壳体加速度振动响应。计算与试验结果表明:文中空心转子的临界转速高于实心转子的临界转速,有涡轮转子的临
量子信息是用量子态编码的信息,由于量子态本质上是空间非定域的,特别是量子态不同于经典物理态,具有非局域性,有些量子态还可能存在纠缠,这就使量子信息具有一些超出经典信息的新功能。深入研究非局域性不仅具有理论意义,而且对量子信息的物理实现具有指导作用。本文研究了量子信息基本理论中与非局域性有关的几个重要问题:纠缠态的判别;纠缠的纯化和提取;正交量子态的局域区分;以及信息熵、纠缠的纯化与提取、正交量子态
大数据、人工智能、云计算、区块链、移动互联等“数智”技术全方位、多维度赋能档案治理,驱动档案治理立体化、系统性、整体式重塑。本文通过分析“数智”话语情境的全面来临和档案治理范式的数智化演进,提出从战略治理、数据治理、智慧治理、文化治理、生态治理五个维度构筑“数智”时代的档案治理路径,推动档案事业数字化数据化转型、智能化智慧化升级,增强档案治理能力,提升档案治理能级,助力档案治理现代化。
太赫兹技术是当下前沿技术领域中应用较为火热的一项技术,给工业发展、农业检测和国家国防事业带来创造性的发展。本文以农作物和农作物内部所包含的植物生长调节剂为研究对象,主要研究了以下内容:(1)获取了包括赤霉素、噻苯隆、氯吡脲在内的植物生长调节剂的太赫兹时域光谱,验证了不同种类的样品对太赫兹波的吸收程度不同,并通过计算获得了对应样品的相关参数如吸收系数、折射系数等。通过相关软件仿真实验,并结合实际实验