论文部分内容阅读
伴随着大数据时代的到来和计算机技术的发展,对复杂网络理论的研究与应用有了新的进展。在现实生活中,许多复杂系统都可以应用复杂网络建模进行分析,比如社交网络、因特网和互联网等等。复杂网络不仅是一种数据的表现形式,也是一种科学研究的方法,通过挖掘这类网络的关键信息从而概括它们的共同特征并进行深入认识。在复杂网络研究中,研究者不仅可以从宏观角度研究系统整体的行为特征,还可以从微观层面上观察内部个体之间的相互作用。在证券市场的发展过程中,繁荣与危机相生相伴,市场的涨跌如影随形。股票价格的波动成了投资者和研究者的重要研究内容。股票价格的变化不仅与宏观经济发展、上市公司基本面有关,同时还会受到市场中其他上市公司的影响。如何理解股票之间关联程度不但有助于投资者构建投资组合,而且有利于管理层对市场的风险控制。中国股票市场中交易的股票有两千多只,它们之间的关系错综复杂。如何在大量的股票之间挖掘一般性特征则显得比较重要。根据已有的金融统计分析发现,传统金融市场的理性投资者、股票价格的随机游走模型以及有效市场假说理论和真实的金融体系中存在一定的偏差,我们需要运用新的方法来研究复杂的金融市场。复杂网络理论的发展,为复杂性研究提供了新方向。复杂性科学在系统的复杂性和演化机制上提供了新的思路。将复杂网络研究引入股票市场,有助于我们对股票市场特征的认识和理解。中国的股票市场发展至今,经历了初创(1990年-1991年)、试验(1992年-1997年)、规范(1998年-2001年)、转轨(2002年-2004年)及重塑(2005年至今)五个阶段。2005年的股权分置改革在中国证券发展史上具有重要意义。股权分置改革以后,资本市场上实现了融资和资源配置功能。中国的证券市场成为新兴市场之一,交易十分活跃。显著的交易量造就了中国证券市场的异常繁荣,2007年底上证指数从股票分置改革结束时的998点上涨至最高6124点。然后证券市场经历了剧烈的暴跌进入熊市状态。从2007年至2014年期间,受到美国次贷危机导致的全球金融危机和欧债危机的影响,证券市场一直处于激烈的震荡过程中。2014年起,中国证券市场新的一轮行情的兴起到暴跌引起了投资者和金融理论研究者的关注。本文以中国上海证券市场交易的个股为研究对象,以股票之间的相关性为依据构建股票网络模型,分析股票收益率之间的相关关联程度的形式及量化,挖掘股票之间相互影响的机制,从系统的角度研究股票网络的结构特征和规律性。本文收集了上证A股市场的828只股票近三年(2014-2017)的每日收盘价数据,基于不同的网络生成机制,剖析了股票市场在较长的时期内一般性特征及市场在不同发展阶段的结构变化特点。首先,通过对股票每日收盘价走势图的比较分析,发现在股票价格之间的非线性关系明显,本文引入互信息作为变量之间的相关关系的度量并以此为构建股票网络的依据。在过去的三年里,中国的股市经历了新的一轮大幅上涨和下跌,股票指数及个股的波动率经历了异常波动,呈现出非线性特征。传统的线性相关显然不能很好的解释非线性关系。在这里引入互信息量描述随机变量之间的关系,并与线性相关系数的结果进行比较。对比发现当股票收益率呈现出异常波动或者上市公司的配股行为导致股票价格的稀释,互信息可以很好的反映它们的变化。在得到股票两两之间收益率相关性矩阵的基础上,将相关性度量转化为网络中的距离度量,从而构建股票网络的最小生成树模型并对拓扑结构进行分析。根据样本数据的特点,通过普里姆算法对距离矩阵压缩,将网络中边的规模降至最小,以最少的边连接所有的股票节点且不构成回路。基于节点度值分布、介数、平均路径及中心性等统计指标分析股票网络拓扑结构,并设计网络关键节点的筛选标准,确定关键节点并测试它们在网络中的作用。并按照股指发展的趋势分阶段构建股票网络并比较不同阶段网络结构的特征。聚类性是真实网络的一个重要特征,由于最小生成树图不构成回路,因此无法分析网络的聚类性。阈值法是分析网络聚类性的重要生成机制,传统阈值法与资产图的生成原理相似,只青睐相关性最强的连接,导致网络中存在大量的孤立点。本文提出优化阈值法,对每一只股票的节点关系设置一个阈值,将股票节点相关性强的那一部分连接构建网络,分析股票网络的聚类性,同时对不同阶段的网络聚类特征进行比较。为了对聚类特征的进一步研究,我们考虑对小规模的聚类形式进行深入分析。在已有的聚类结果基础上对网络中的信息继续筛选,通过极大平面过滤图,该生成机制在确保网络的平面拓扑结构前提下,研究网络中小集团的形成机制和差异性。根据上述研究过程,我们得到了股票市场特征的相关结论。首先,各板块内部的平均相关性水平相似,但是板块间的相关性水平差异明显,金融板块与其他板块股票之间的相关性水平最低。其次,和大多数实际网络一样,从各种网络生成机制构建的股票网络均具有无标度性、小世界特征以及幂律分布。网络中仅有一小部分股票节点与其他股票节点直接相连,而大多数股票之间并不直接相连,但是网络的平均路径比较小,即网络中只有少数的关键节点。对比三个不同阶段的最小生成树图,股指上涨阶段股票节点度值的差异性减小,股票之间的相互影响比较活跃;在股指下跌阶段,股票节点度值分布差异性加剧且平均路径变大,即股票更倾向于与关键节点相连并且股票之间对利空消息的传递会延迟,说明在下跌阶段市场对利空消息的消化与吸收持续时间比较长。而在恢复阶段,节点度值分布差异加剧但网络中的平均路径比较小,的网络结构兼具上涨和下跌时的结构特点,反映出市场对利好消息的期望同时又兼具下跌时期的惯性。并且在不同阶段,各板块对股票网络的影响力度是不一样的。第三,由阈值法生成的网络中股票节点的聚类性显著。随着网络中边的规模不断增加,新加入的边更倾向于连接中心节点。在上升阶段,网络中的聚类系数明显上升。在下跌阶段,网络中的聚类系数不仅上升,而且同步性上升尤其突出。说明了股票网络中股票同跌的程度明显高于同涨的程度。经过三阶段的对比分析,下跌阶段网络中的聚类程度和同步性是最高的,恢复阶段的聚类系数受到调整参数的变化比较明显。即说明了股市在下跌过程中具有较强的聚类特征和同步特征。通过这两指标的监测,可以预先对股市下跌风险进行防范。最后,在阈值法的基础上再次过滤掉网络中复杂拓扑结构的信息从而得到小规模聚类的3-派系和4-派系。网络中4-派系的数量规模小于3-派系;而且上涨阶段网络中的派系明显比下降阶段的多。其次,即便是同一板块股票构成的4-派系,派系的平均相关程度是存在差异的;下降阶段中由不同板块股票构成的派系比上涨阶段多。三个阶段的股票网络结构对比可知,股票市场在上涨阶段和下降阶段的信息是不对称的,受到利好消息影响时,股票之间相互影响加强,不论是板块内部影响还是板块外部影响;而受到利差消息影响时,市场的恐慌无形中被严重放大,股票价格趋向于同时下跌。本文借鉴相关理论研究,以复杂网络模型对股票市场的整体行为特征进行实证分析。本文的研究贡献主要集中在以下几个方面:第一,在分析股票之间收益率相关性时,发现股票价格波动的非线性趋势明显,因此选择互信息量来描述这种非线性关系,这个方法比现在普遍使用的线性相关系数更具优势。第二,在分析股票网络聚类特征时,在传统单一阈值方法基础上,本文提出了一个新的阈值生成机制。针对不同板块股票的相关性水平差异,新方法针对每只股票设置一个阈值。并引入统计分布来优化阈值。该方法解决了传统方法中遗漏股票节点的问题,比传统阈值方法更具意义。第三,但是为了保证平面性,极大平面过滤图方法保留了相关性比较低的节点关系。为了过滤网络中冗余的信息,本文在阈值法的基础上提出了一个新的极大平面过滤图方法。这个极大平面阈值法保证了网络节点之间的高度相关性,同时也具有网络的平面性。