论文部分内容阅读
成分数据是一类复杂的多维数据,主要用来研究构成某个整体的各部分的比例.成分数据近年来被广泛应用在地质学、社会结构和经济发展等方面.由于在调查中的无回答、数据收集过程的失误都会导致数据缺失,而数据缺失会影响统计数据的质量,致使增大了统计分析结果中的估计方差,从而降低统计数据的说服力.因而对缺失数据的填补变得十分为重要.本文主要针对成分数据的缺失值填补方法进行研究,对于含多重共线性的成分数据,提出了主成分分析的填补法;对于既含多重共线性又含异常值的成分数据,提出了基于MCD估计的主成分填补法.全文共分为五章:第一章,介绍了成分数据的研究背景和意义,以及缺失数据的研究现状.第二章,给出了成分数据的定义以及所属空间上的运算,其次给出了常用的三种对数比变换和球坐标变换,并回顾了常用的普通数据和成分数据的缺失数据填补法.第三章,针对含有多重共线性的成分数据,提出了单形空间上的均值填补法和基于主成分分析的填补法,并通过实例分析和实验模拟验证新提出填补方法的精准度.第四章,在第三章所提出填补法的基础上,针对含有异常值的成分数据提出了基于MCD估计的稳健主成分插补法,再次通过实例分析和实验模拟验证新方法的合理性.第五章,总结概括本文的研究工作和结果,提出不足之处和待解决的问题.