基于成分数据的缺失值补全方法研究

来源 :山西大学 | 被引量 : 6次 | 上传用户:zwsbjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
成分数据是一类复杂的多维数据,主要用来研究构成某个整体的各部分的比例.成分数据近年来被广泛应用在地质学、社会结构和经济发展等方面.由于在调查中的无回答、数据收集过程的失误都会导致数据缺失,而数据缺失会影响统计数据的质量,致使增大了统计分析结果中的估计方差,从而降低统计数据的说服力.因而对缺失数据的填补变得十分为重要.本文主要针对成分数据的缺失值填补方法进行研究,对于含多重共线性的成分数据,提出了主成分分析的填补法;对于既含多重共线性又含异常值的成分数据,提出了基于MCD估计的主成分填补法.全文共分为五章:第一章,介绍了成分数据的研究背景和意义,以及缺失数据的研究现状.第二章,给出了成分数据的定义以及所属空间上的运算,其次给出了常用的三种对数比变换和球坐标变换,并回顾了常用的普通数据和成分数据的缺失数据填补法.第三章,针对含有多重共线性的成分数据,提出了单形空间上的均值填补法和基于主成分分析的填补法,并通过实例分析和实验模拟验证新提出填补方法的精准度.第四章,在第三章所提出填补法的基础上,针对含有异常值的成分数据提出了基于MCD估计的稳健主成分插补法,再次通过实例分析和实验模拟验证新方法的合理性.第五章,总结概括本文的研究工作和结果,提出不足之处和待解决的问题.
其他文献
随着人类社会劳动复杂程度的不断提高,人力资源管理在当今企业中是必不可少的一项重要工作,笔者根据多年经验对本文做出了详细的阐述,以便同行工作者的参考.
GaAs太阳电池是目前大部分航天器的主要动力来源,因此有必要对其在空间辐射环境条件下的性能衰减进行评估,以优化电池的辐射防护措施,保证电池在空间应用的高可靠和长寿命的要求
韩愈是我国古代重要的教育理论家,对教育作用、教育目的、教学方法、人才选拔与培养等方面都提出了独到的见解。笔者试图在探究的过程中,紧随21世纪基础教育改革大潮,结合当代教
中国文化源远流长,作为一个发展的国家体育散发着浓厚的文化底蕴。本文针对篮球课程培养学生体育素质,对影响学生的篮球意识进行主要教学,实现素质教育深入到体育教学中。并且通