论文部分内容阅读
随着计算机软件与硬件的快速发展,人们能够获取并需要分析的数据量也随之越来越大,这使传统的数据分析方法受到了一定的限制,再加上在实际应用中,许多所研究问题中的个体(即样本)往往呈现连续性的特点,即产生样本数据的间断性越来越小。此时,用函数型数据分析(Functional Data Analysis,简称FDA)来研究样本的指标将更加合理。因为函数型数据分析法不但可以实现对高维数据的分析,还不强制不同观测样本的观测点与观察次数一致。在我国的股票指数中,上证指数与深证成指分别是上海与深圳涵盖面最广、最具有综合性的股票指数,而创业板指与中小板指也是板块指数中较为重要的两大指数,这四个指数不但是股民最常参考的指数也是学者们最常研究的指数,故本文选取了这四个指数进行分析与讨论。本文首先回顾了函数型数据分析产生与发展,发现将函数型主成分分析应用于股指分析不但有助于读者从另一角度了解股指变化规律与趋势,还使此方法的应用领域得到拓展,使其更加丰富。其次,研究并阐述了基函数拟合与函数型主成分分析的理论,并在基函数拟合中,在基函数个数的确定方法上引入了时间序列中AIC准则的思想,从而定义了FIC准则。最后,本文对2014年每个交易日的上述四个指数的收盘值作了实例分析。先用三组常见的基函数分别对四个指数拟合,通过比较分析最终确定了由傅立叶基函数进行拟合,得到了四个指数函数,四种指数的拟合相对误差之和均小于5。又对这四个指数函数进行函数型主成分分析,得到的前两个主成分的累计贡献率就已超过99%,可见信息量的损失很小。通过观察各个指数分别在两个主成分下的得分不难发现:上证指数、深证成指、创业板指主要受第一主成分的影响;中小板指受第一主成分与第二主成分的共同影响。再结合实际情况分析得知:第一主成分所反映的应该是系统内部为保持稳定的自我保护因素;第二主成分所反映的应该是宏观环境对股指均值影响的综合因素。