面向二维数据的核二维岭回归方法在子空间聚类中的应用

来源 :青岛大学 | 被引量 : 0次 | 上传用户:xfzhang901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法是数据挖掘的主要任务之一,其主要用于发现数据库中未知的对象类别。子空间聚类作为目前主流的聚类分析算法,被广泛运用于计算机视觉、人工智能、网络分析和模式识别等领域。目前关于子空间聚类算法的研究成果繁多,其中基于谱聚类的子空间聚类算法具有显著的聚类效果。在聚类分析的应用领域中,高维数据普遍存在,尤其是面向二维数据的(即一个样本为一个矩阵)算法研究十分匮乏。对于二维数据来说,现有的子空间聚类方法通常需要将二维数据转化为向量作为数据的预处理,然而这种方法严重损坏了二维数据的结构信息,忽略了原始结构和原始数据的重要关联性。为了克服现有子空间聚类算法的不足,本文提出了一种面向二维数据的基于核和岭回归的子空间聚类算法,命名为KTRR。本文对于聚类算法的研究如下:(1)在数据预处理阶段,与现有方法不同KTRR直接在二维数据上寻求低维表示,并在模型中引入投影矩阵,将数据投影到二维信息量最大化的子空间中得到数据信息最丰富的二维特征,从而利用二维数据固有的结构信息提高模型的学习能力;(2)数据的非线性关系普遍存在,本文充分考虑了数据的非线性结构,在算法模型中引入核方法,提高了模型对于二维数据的非线性关系的捕获能力,从而寻求更精确的低维表示;(3)KTRR算法模型为一体化学习模型,其优势在于将特征提取、非线性学习,表达系数学习三种学习目标整合于一体,在模型优化过程中各个学习任务能够相互促进,进而提升算法的的整体学习能力;(4)本文提出了一个有效的优化算法对目标函数求解,能够从理论上保证目标函数值的下降和收敛。大量对比实验结果表明了本文提出的KTRR算法与当前主流子空间聚类算法相比具有良好的聚类性能。
其他文献
颅面修复与复原技术在刑侦领域、考古领域和医学领域均存在较大的研究价值和意义。本论文基于曲线回归模型实现对颅面修复与复原问题的研究,主要的创新与研究工作如下:1.提出基于径向曲线与最小二乘支持向量回归的颅骨修复;将颅骨上提取的径向曲线作为训练样本数据,构建颅骨径向曲线的回归模型,通过回归模型获得待修复径向曲线和已有径向曲线间的关系,修复缺失部分的径向曲线,再根据颅骨统计模型复原出缺失颅骨的完整模型。
本文以电子病历数据为研究对象搭建糖尿病风险预测模型,探究适应体检数据的空腹血糖预测模型。预测糖尿病患病风险对该疾病的发现和治疗具有指导意义。所构建的模型能使体检者通过体检数据便可预测未来一年糖尿病患病风险。本文基于数据挖掘基本流程,探究适合体检数据的糖尿病患病风险预测模型算法,进行如下工作:对从某体检机构获取的原始数据进行数据预处理,获得7118名体检者连续三年的体检数据;在数据降维过程,使用序列
铱星作为广泛应用于海洋及军事领域的卫星通信系统,其信号质量的稳定对铱星通讯终端的正常通信及能量的高效利用具有重要作用,但目前关于铱星信号质量的研究开展相对较少,且成熟的铱星信号监测体系尚未建立。所以,基于当前的主流时序数据分析方法,构建铱星信号质量预报机制不但能够弥补传统铱星通讯终端数据传输的缺陷,而且可以为日后建立完整的铱星信号质量监测体系提供参考依据。因此,本文选用预测精度较高,且在各领域中取
随着计算机和信息技术的迅速发展,关系数据库的应用越来越广泛,关系数据的安全和版权保护问题也日益受到重视。关系数据库水印作为版权保护的一种重要手段,在不破坏数据本身的可用性的情况下,要求能在数据中嵌入证明版权所属关系的重要信息,并且在遭受恶意攻击以后,仍能以一定的比例检测到水印信息的存在,从而起到版权保护的作用。因此,关系数据库水印研究在实际应用中具有较高的价值和研究意义,近年来也成为当前研究热点之
热阻是物体对热量传递有阻碍作用的物理量,其定义方式与电阻类似,为热阻两侧温度差与流过热流的比值,与传热系数互为倒数。可通过减小热阻加强传热,也可增大热阻削弱传热,可直接影响内部温度,因此对可变热阻的调控在实际应用中尤为重要,被广泛应用于温度控制、建筑、精密仪器等。半导体热电效应主要为帕尔贴效应和塞贝克效应,能够实现热能和电能之间的相互转化,通过控制热流实现变热阻控制。相较于其他形式的变热阻,半导体
互联网的高度普及,使得信息安全得到广泛关注。信息隐藏技术是信息安全范畴内的一大分支,在保密通信和产权保护方面,得到了广泛研究与应用。社交网络的迅速发展极大方便了人们的生活,众多的社交软件和短视频自媒体平台为信息隐藏提供了新的载体可能。本文进行了基于社交网络和短视频平台的信息隐藏研究工作,主要研究内容如下:(1)提出了一种基于网络社交行为的生成式信息隐藏方法。目前基于社交行为的信息隐藏方法都只利用单
目前文本隐写方法可以分为修改载体法和无载体法。由于文字本身的编码冗余度很小,对文本很轻微的改变都有可能被人或机器检测出来,因此修改载体法隐藏容量较小,安全性较差。无载体隐写可以分为生成法和检索法。其中,生成法的载密文本是根据传递的秘密消息借助于自然语言处理技术生成的。虽然自然语言生成技术已有很大进步,但在生成较长文本时仍存在可读性差的问题,很容易被人识别出来。而检索式无载体方法通过建立映射关系,找
随着电气化的飞速发展,伺服系统已经从早期的液压伺服系统过渡到当前的电机伺服系统。伺服系统作为运动控制系统执行机构的核心部分,其性能是整个控制系统性能的重要衡量指标。以工业机器人为例,工业机器人在搬运、焊接、激光切割、喷涂等应用场景中具有高精度位置控制、负载时变、启停频繁且响应快速等特点,这就需要机器人关节处永磁同步电机同时具有高精度、快速响应和更强的抗干扰能力。近些年随着智慧工业的发展,为了简化系
永磁同步电机(Permanent magnet synchronous motor,PMSM)因具备制造成本低、结构简单等优越性而被广泛应用于各个领域中,所以对于PMSM驱动系统的控制算法有了更高的要求。为了保证PMSM具备良好的动态与稳态性能,分别从动态控制和稳态控制的角度出发设计出不同的控制器,并将这些控制器利用协调控制策略协同起来,达到了PMSM驱动系统的高性能要求。论文主要内容为:(1)研
多容水箱系统具有多变量、强耦合、高非线性和复杂度高的特性,是非线性控制理论应用的重要领域之一。这些特性都会影响控制系统的稳定性,而且多容水箱系统受未知扰动和参数的不确定性影响较大,使得控制任务更加复杂,多变量的精确控制也非常困难。因此,解决多容水箱系统的扰动抑制和多变量控制中的问题对于工业生产具有重要指导意义。(1)采用了一种基于扰动观测器的积分反步控制策略处理双容水箱系统存在的扰动影响。首先,为