单纯形空间中多元成分数据的有监督降维

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:ghanfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据的火热,人们面对的数据越来越复杂,常常能收集到高维的复杂数据,也因此在统计分析时常会面临维数祸根问题。为了克服维数祸根问题,同时充分挖掘数据的有用信息,充分性降维方法越来越受到广泛关注。成分数据是传达比例信息的数据,描述着一个整体的结构特性,主要用于系统结构发展趋势的预测,它广泛存在于众多领域,但由于其特有的数据特点——“定和”约束,传统的统计方法无法直接使用,现有的对于成分数据的降维方法十分有限。鉴于此,本文提出一种新的成分数据有监督降维方法——成分数据方向回归降维方法(Co DR)。首先,我们将经典的方向回归方法(DR)的理论框架进行推广,在多元成分数据下,给出了中心降维子空间的具体形式,并通过引入Aitchison几何和等距对数比变换,给出了成分数据方向回归降维方法的具体算法。该方法能够在单纯形空间快速实现对多元成分数据的降维,同时不损失多元成分自变量包含的因变量的回归信息。为了对所提出的Co DR方法的表现进行评估,我们做了大量的数值模拟实验,考虑了多种分布下的成分数据,多种多元成分变量内部和外部的相关结构和相关强度,以及不同结构维数的降维空间的情况,将所提方法与已有的成分数据切片逆回归方法(Co SIR)和成分数据切片平均方差估计(Co SAVE)方法进行比较,模拟结果表明Co DR方法估计的中心降维子空间拥有更小的估计误差,并结合了Co SIR和Co SAVE方法的优点,既可以估计出偶函数情况下的有效降维方向,又可以在小样本量的时候仍然具有较好的降维效果。另一方面,实际中结构维数通常是未知的,我们提出了BIC型的信息准则来根据数据自适应地确定结构维数。数值模拟表明随着样本量的增大,其估计的精度越来越高,从数值上证明了其相合性。最后,本文将所提Co DR方法应用于城镇居民可支配收入数据,研究地区国内生产总值、固定资产投资总额、城镇单位就业和城镇单位就业工资对城镇居民可支配收入的影响,并建立回归模型进行预测分析。基于Co DR方法降维得到的充分成分协变量建立部分线性模型,并与Co SIR和Co SAVE两种降维方法的预测效果进行对比分析,基于200次的交叉验证实验表明基于所提Co DR方法寻找的降维方向建立的模型具有更小的预测误差,体现了所提降维方法在成分数据分析中的合理性和优越性。
其他文献
土地督察的纠正机制是指国家土地督察机构基于发现地方土地违法问题,依法依规提出整改纠正的意见和要求,且按照一定的程序和方式督促地方政府采取措施予以整改纠正,消除土地
学位
本文以自我俗民志为写作方法,展开一名咨询心理学方向硕士生曲折的心理学知识追寻、自我整合的历程,试图以这一整合研究者与研究对象的方法弥合主客二元对立,以叙事为主线揭示个体经验下折射的群体经验,以论述为辅助深入反思、延展个体经验。全文主要分为七大部分,第一部分引言,简单概括作者以自我俗民志写作的初衷,第二部分介绍自我俗民志方法的精髓、产生、发展及现状。第三部分论述心理学作为人文科学的逻辑和传统,以及自
学位
比特币自2008年提出以来,之后便引领时代的风潮。作为一种加密货币,其基于区块链技术而产生,具有稀缺性的特点,受到了市场极大的关注,给传统货币带来了一定的冲击。之后,以比特币为代表的虚拟货币也在不断产生,到现今已有3000多种。自从机器学习算法提出以来,许多学者都在研究将机器学习算法应用于金融市场中,期间产生多种算法,促进了量化投资的发展。传统的时序神经网络(也称循环神经网络)在预测领域存在很大的
随着我国经济的不断发展,需要处理的城市污水量越来越大。污水处理厂在处理污水使之达到排放标准的同时,也会产生越来越多的剩余产物,即城市污水处理厂剩余污泥。剩余污泥含
《普通高中化学课程标准(2017年版)》由教育部于2017年颁布,与2003版的课标相比,2017版课标提出了学业质量标准和学科核心素养这两个概念,2017版课标不仅对学生应了解掌握的学科知识作出了要求,更对学生解决问题的能力和素养提出了培养要求,同时也为教科书的编写、教学和评价等,提供了方向。2019年新版人教版化学必修两册教科书正式发行,随之苏教版、鲁教版地方教科书也陆续完成编订,教科书的课后
随着国内经济下行压力增大,行业竞争越来越激烈,企业的生产经营出现了很多不确定性,面临的风险也愈来愈多。为了应对外部环境的变化,企业纷纷采取多元化战略。但是,多元化扩张过于激进,企业将面临高负债、现金流断裂、经营困境等,最终导致企业陷入债务危机中。本文以银亿股份作为研究对象,对其进行了案例分析。首先,本文归纳和梳理了与多元化动因、债务危机成因、多元化战略对债务危机的影响等相关的文献。其次,本文介绍了
城建声像档案编研不仅是城建声像档案开发利用工作的重要内容,也是城市发展建设的客观需要。本文在梳理城建声像档案编研相关概念的基础上,分析城建声像档案编研的意义,进而通过个案分析和网络调研探究我国城建声像档案编研工作现状,最后结合该领域存在的问题提出相对应的解决策略。本文主体部分包括以下内容:第1章是“绪论”,本部分介绍研究背景和研究意义,梳理并分析国内外城建声像档案编研的研究现状,描述了研究的内容、
学位
知识分类理论将学习的知识分为陈述性知识和程序性知识。程序性知识的学习是一种间接推论知识的过程,在学习中需要借助抽象思维来概括加工和处理知识,进而促进知识体系的形成和完善。程序性知识的学习注重思维和辨识能力的培养。在2017版《普通高中生物学课程标准》中强调对学生核心素养能力的培养,要求在生物学教学中强化学生创新思维能力的训练。因此,在中学生物学教学中需要对程序性知识的教育学习方式进行再一次的更新。
2012年11月上海市教育委员会决定在本市部分高中开展“高中体育专项化”课程改革,经过几年改革的探索,专项化体育教学深受好评,学生对体育课的兴趣明显增加。在总结课程改革经验的基础上,经过充分调研和论证后,2015年9月上海市拉开了“小学体育兴趣化”课程改革的序幕。课程改革的实施,小学体育教师的注意力由传授运动技能转向激发学生的兴趣,小学体育课堂随之出现了一些令人惊喜的转变,学生的运动积极性得到提高
学位