【摘 要】
:
现有统计调查中存在大量定性和定量的混合数据,为了能用较少指标进行分析,可以采用主成分分析的方法。然而,传统主成分分析要求数据符合正态化假定,且所有变量被标在数字层面
论文部分内容阅读
现有统计调查中存在大量定性和定量的混合数据,为了能用较少指标进行分析,可以采用主成分分析的方法。然而,传统主成分分析要求数据符合正态化假定,且所有变量被标在数字层面时,得出的结果才有效。显然,混合数据并不满足以上条件,从而导致错误结论。因此,研究混合数据的主成分分析是有必要的。本文以主成分分析方法为基石,从数据变换、相关性特征提取以及数据中心化这三个方面出发,结合数据预处理、polyserial和polychor相关、广义奇异值分解(GSVD)和对应分析(MCA)等处理手段,使混合数据分析的主成分方法更有效。本文结合Gironde地区统计调查数据中11个定性变量和16个定量变量,利用R软件分析,得到特征矩阵的主成分降维效果较好,经过GSVD和MCA处理的主成分与原始数据相比,其5分类的聚类分析结果更符合Gironde地区城镇社会发展水平情况。从方法处理的复杂程度和分析结果的解释能力可以发现,数据变换解决了定性数据量化问题,特征矩阵可解决常规相关系数不能计算混合数据相关性问题,基于GSVD和MCA的方法可以处理混合数据主成分提取问题。本文的结论为利用主成分分析方法对混合数据降维,以及进一步的诸如聚类等多元混合数据分析过程提供参考。
其他文献
文章分析了自动化技术内涵,同时阐述了中小型水厂应用自动化技术的必要性,最后结合工作实际,围绕中小型水厂自动化技术的具体应用进行分析探讨。旨在帮助中小型水厂更科学的
形象思维是语文教学中经常会运用到的一种思维模式,无论是散文教学还是小说教学,都需要学生拥有较强的形象思维能力,将作者描绘的场面,通过自己的想象展现在眼前。同样,在高
电影发行是流通环节,是连接制片方与放映方的中间方,它本身不直接创造价值,但却起到了为影片价值增值的作用。回顾中国电影发行业的四十年改革发展之路,尤其是21世纪以来,互
传统水热合成法制备的TS-1分子筛,因其独特的孔道结构使其在物质分离、催化反应等方面得到广泛的应用。但TS-1分子筛的微孔孔径只有0.5 nm使其分离性能受到限制;且利用传统TS
<正>二○○三年的春天,我刚到上海大学工作不久,那一年的硕士招生就开始了。在面试现场,有一个女孩,瘦小,神情有点怯,但是一开口,怯怯的神情就走了。说话慢条斯理,读了许多书
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
以卡拉胶与其它食品复配后用于压制火腿制作,通过测定成品抗压强度和失重率,得出抗压强度与不同食品胶配比关系的回归方程,通过方程得出了最优的复合食品胶复配比例。
介绍了高炉煤气余压发电的工作原理及透平机壳变形的危害,从制造、检修、运行等方面分析了透平机壳变形的原因,并提出了相应的解决方案。
创新是高等教育质量提升的动力,是内涵式教育的源泉,高校是培养国家新型人才的摇篮,担负着为国家输送创新人才的任务,本文通过对创新理论和高等教育创新的探讨,对高等教育创新的内