超高维部分函数型线性模型的特征筛选

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:tingxin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息技术的快速发展,复杂数据已经越来越常见.在复杂数据中,函数型数据和超高维数据已经出现在心理学、经济学、气象学、医学、生物学等许多领域.函数型数据是伴随着某一连续变量(时间、空间)变化的数据,呈现形式可以是曲线、平面或者三维空间等.函数型数据的主要分析方法是将数据映射到一个有限的基空间上来降维,例如函数型主成分分析,样条展开等等.在统计研究中,将变量维数随着样本量9)的指数次方发散的数据称为超高维数据,即log()=(9)),一般要求>0.超高维数据的主要处理方法是先对变量进行特征筛选,再进一步建立模型.虽然函数型数据和超高维数据已经受到了一定程度的关注,但是由于两种数据本身的复杂性,对于同时包含函数型数据和超高维数据的混合数据并没有太多的研究.本文考虑了一种响应变量为标量、预测变量同时包含函数型和超高维标量型的线性模型,模型满足稀疏性假设.我们结合向前回归和组变量选择,提出了FRg SCAD方法,同时对函数型预测变量和标量型预测变量进行变量选择,并且给出它们的系数估计.第二章介绍了函数型主成分分析的基本原理,模型识别的一些准则,以及组变量选择的方法.第三章介绍了我们提出的的变量选择方法,并在一定条件下,证明了向前回归可以在模型中同时包含函数型变量和超高维标量型变量时也可以依趋于1的概率筛选出所有的重要预测变量.由于向前回归算法得到的是一个嵌套模型,考虑使用EBIC准则选取最优模型,并且证明了此最优模型也具有筛选相合性.第四章给出了所提方法的统计模拟,模拟结果验证了所提方法的优良性.
其他文献
目前,我国农村正处于城镇化建设的关键时期。有关土地流转、征地拆迁、农村集体产权制度改革、城乡户籍壁垒和制度改革、农业转移人口社会保障、农业生产安全问题等“三农”
沿面介质阻挡放电(SDBD)是一种常见的低温等离子体产生形式,电极分布在介质板上下两侧,放电沿着介质表面进行。沿面放电可以在介质表面产生较大面积的均匀等离子体层、并将电
近年来生态环境损害赔偿案件频发,但是我国目前的司法实践现状基本都是判决被告赔偿生态修复费用和生态服务功能的损失,生态损害的预防责任在司法实践中并未体现出应有的价值
近年来,随着计算机图形学的蓬勃发展,三维建模技术开始广泛应用于虚拟现实、电影动画特效制作等各个领域中。三维配准技术是三维重建的一个重要问题,点云配准算法的设计直接
人群计数是公共安全研究领域的关键和基础问题。随着图像数据的爆炸式增长和深度学习技术在计算机视觉领域的飞速发展,基于深度学习技术的人群计数或人群密度估计是一个关键
目的:通过对发育期暴露5-氮杂胞苷(5-Azaytidine,5-Aza)对成年期小鼠及其后代甲基化调控系统的影响研究,探讨异常DNA甲基化模式的可遗传性;并通过行为学试验研究具有焦虑抑郁样行为母鼠的抚养对后代小鼠的影响,进一步探讨DNA甲基化模式遗传性的稳定性。方法:2周龄小鼠随机分成2组,5-Aza组小鼠腹腔注射5-Aza,对照组给以等量盐水。小鼠7-8周龄时进行行为学实验,行为学试验结束后部
随着社会主义市场经济的不断发展,在现代商业社会中,消费者的地位显然要弱于经营者,经营者为了自身利益而侵害消费者权益的现象屡屡发生。相对于传统的民事诉讼事件,现代型纷
目的对国内外糖尿病高危足患者健康教育的相关指南进行整合,形成本土化的最佳证据。方法通过计算机检索JBI循证卫生保健国际合作中心图书馆、Cochrane Library、BMJ最佳临床
随着社会的进步和经济的发展,各方面的竞争越来越激烈。在此背景下,社会对德智体美劳全面发展的高素质人才越来越重视。然而目前学生身体素质持续下降,学不会运动技能,不得不
近年来,在图像检索领域,大量的方法利用人工标注的图像进行有监督哈希学习,并通过训练的哈希函数将图像映射为二进制的哈希码进行图像检索。但是由于人工标注过程的巨大人力