论文部分内容阅读
成分数据是一类具有复杂性质的数据,其最大特征为数据变量总和为定值(例如100wt.%)。地球化学数据就是一种典型的成分数据。由和为定值引起的“闭合效应”将导致地球化学数据产生伪相关,使地球化学元素间的相关性的分析结果有偏差,同时也使多元统计方法不能直接在简单欧氏空间中进行。以往的地球化学数据预处理工作多数是将数据进行直接对数变换,但并不能消除成分数据结构中的“闭合效应”。本文以甘肃省尖山-平口峡地区的1:20万岩屑地球化学数据为例,利用直接对数变换、加性对数比变换和中心对数比变换进行预处理,进而展开单元、双元、多元统计分析,包括统计参数分析、相关性分析和主成分分析。最终,结合地质认识,将不同成分数据处理得到的结果(包括单元素地球化学模式及多元统计分析)进行对比研究,探讨地球化学成分数据处理方法的异同及优劣。通过对比讨论,本文取得以下主要认识:(1)尽管中心对数比变换与加性对数比变换在改变原始数据偏度峰度特征上与直接对数变换相似,都可以使原始数据趋于正态分布,但对数比变换同时考虑了各元素间存在的相对信息。(2)在研究地球化学数据元素间相关性时,对于常量元素,加性对数比变换方法是一种有效打开地球化学成分数据的方法,其可以减小成分数据中的闭合效应,在一定程度上消除变量间的伪相关。中心对数比变换会造成元素间大量负相关。另外,由于微量元素在地球化学样品中含量很低,其受闭合效应影响微弱,因此,当仅涉及微量元素的相关性分析时,直接对数变换是最为简单有效的方法。(3)研究区有大量的侵入岩出露,因此在运用成分数据处理方法做主成分分析时,除了加性对数比变换获得的第一主成分外,直接对数变换和中心对数比变换方法的主成分元素组合大部分能够代表有关岩浆侵入的地质过程:(1)与超基性岩及铜镍矿有关的地质过程;(2)与酸性岩有关的地质过程;(3)与过碱性花岗岩有关的地质过程;(4)与风化产物有关的地质过程。通过对比可以发现在运用主成分分析方法进行数据降维时,直接对数变换和中心对数比变换效果和质量更好。