论文部分内容阅读
我国的投资市场长期处于个体投资者占据绝大多数的环境中,投资者的情绪对于我国市场经济有着决定性的重要作用。从市场经济运行的角度来看,多数学者都认为,投资者的情绪和收益波动率之间是呈正向相关的,即投资者的情绪愈是高涨,其收益波动率也愈大。本文通过利用文本数据刻画了投资者的情绪,基于异质市场假设提出HARQ-RV-CJ-SENT模型,改善了对已实现价格波动率的预测效果,并从因果检验的角度深入分析了二者之间的因果关系。波动率刻画了金融资产的随机波动程度,为了对其特点进行深入的刻画,国内外大量学者针对自回归条件异方差(ARCH)模型和随机波动率(SV)模型等问题进行了重要的改善和拓展,但这两类传统的模型都存在着两个不小的缺陷:一是大量使用低频的交易数据,损失了日内交易信息,二是需要对其进行复杂的参数估计,计算的操作过程比较繁杂。随着移动互联网的进一步发展和电脑存储技术的改进和革新,高频交易数据的获取越来越方便,一些基于高频数据的波动率度量方法被陆续研究和提出,对股市波动率进行模拟和预测更为精准和方便。Andersen在1998年提出了已实现波动率(Realized Volatility),即日内高频数据对数收益率的平方和,这种估计是对于金融资产真实波动率进行的一致非参数估计。使用己实现波动率来进行波动率度量时,具有比较好的稳健性,其计算简单,并且在无偏差方面得到了保障。已实现波动率的方便性和准确性为股市波动率的分析带来了便捷和精确,学者们在将它作为波动率的度量方式后,参照金融市场的规律,尝试各种时间序列分析的手段进行预测。异质市场假说认为,交易者各种特征的情况诸如对于风险投资偏好和对于整个市场的风险预期等都可能具有不同的异质性,虽然我们目前无法直接地对市场交易者各种特征的情况进行准确观测,但这最终的结果可能会直接体现在市场交易量和频率之间的巨大差别。Corsi参照异质市场假说,于2004年把波动率异质的分解后成为短期、中期和长期三种不同的波动率,并以此基础来构建异质自回归的已实现波动率预测模型(HAR-RV)。之后,HAR族模型不断进行改善。Bardorff于2004年提出了双次幂变差(Realized Bio Power Variance,BPV)的概念,将样本方差分解成两个部分,即连续的样本路径方差与离散跳跃方差,并将所有被提取的跳跃组成分都加入到HAR模型中,构造了HAR-RV-J模型。Andersen于2012年尝试构建统计量对离散和连续波动进行检验和分离,提出了HAR-RV-CJ模型。Bollerslev于2016年对已实现波动率和真实波动率之间的关系进行了论证,并提出了HARQ-RV模型对HAR模型的偏离性做出纠偏。这些改进的模型对于已实现波动率有着更好的预测效果。另一方面,在金融市场中,异质性也体现在投资者的行为上。传统的金融理论一般都认为,投资者都是保持着一种理性的投资心态,一是人们不容易受到市场复杂信息的干扰和误导,二是不同的理性投资者面对相同的市场信息和交易背景时,会有趋于一致的情绪反应。然而,经过国内外专家学者的证实,投资者的各种行为都具有差异性,一个原因是由于投资者本身的接受教育水平、地理人文环境和社会心理等方面和因素之间存在着较大的差异,另一个原因是由于不同的投资者对于这些市场信息的接收以及掌握情况的程度也不同。因此,投资者行为的异质性造成了各种收益异象,也是异质市场假说的成因之一。如何从统计学和市场经济学角度出发对投资者的情绪进行分析研究,如何对投资者的情绪采取合理度量方法,如何研究投资者情绪与市场的相互影响机制以及如何解释市场上各类投资收益异象,成为现今我国经济学领域中一个新的重要研究课题和热点。关于投资者情绪的研究主要包括两个组成部分,一是针对投资者情绪指标进行构建的方法,二是投资者情绪指标在不同金融学理论的应用。最初,国内外的学者们利用调查问卷的方法,如通过问卷中看涨看跌人数的比例进行构建,这样得到的情绪指标较符合心理学的研究特征,但样本范围有限,调查过程实施困难,代价较高,且数据难以更新。目前对于金融领域中的投资者情绪指标构建方法大多采用了主成分分析的方法,即选取金融领域中数个比较具有代表性的变量作为主成分进行分析,以便于得到投资者的情感指标,这样所获得的投资者情感指标比较易于实现,但解释能力较弱。因此个别研究者开始利用文本分析的方法,通过对大量的投资者文本数据进行词典构造和文本学习的方法构建出投资者情绪的指标,这样得到的情绪指标具有很好的解释能力。在对投资者的情绪性指标和其与市场收益之间关系的相应研究中,主要集中于以下两个研究方向。第一是投资者的情绪在股票市场价格波动率度量和预测模型上的运用。通常主要方法是通过选取某个模型构建量化的指标,将其作为投资情绪的一个代理变量,然后加入到如GARCH类的模型或其他市场波动率模型中完成股票市场的收益波动率的度量和预测。第二是对投资者情绪与市场整体收益波动率相互影响的理论研究,同样也是先通过选择合适的投资者情绪指标作为代理变量,之后通过对情绪代理变量与市场波动率的格兰杰因果关系检验进行分析,并最终确定投资者情绪与市场整体收益波动率之间的相互影响关系。本文通过文本分析的方法构建出投资者情绪的指标,并将其加入到HARQRV-CJ模型中,HARQ-RV-CJ模型在HAR模型的基础上有所改进,一是将波动分为离散波动和连续波动两部分,二是对于已实现波动率和真实波动率之间的差异进行了纠偏。之后,本文在牛市、熊市、震荡市三种不同的市态下分别对日、周、月波动率进行了预测,并研究了投资者情绪和市场已实现波动率的影响关系。实证中,本文爬取了东方财富网上证综指股吧2014年4月16日到2020年11月30日的约501万条贴子作为投资者情绪构建的文本数据,之后选取了上证综指2014年4月16日到2020年11月30日的收盘价5分钟高频数据来进行已实现波动率的构建。研究发现,在各个市态上投资者情绪都是已实现波动率的原因;加入情绪指标后提升了HAR-RV族模型的预测能力;在三个市态下短期投资者仍然占据主导地位,市场容易受到短期投资者的冲击;模型在熊市上有着最好的建模效果。