论文部分内容阅读
现有研究提出了众多的异象因子,但因子数目太多以至于无从选择并纳入定价模型。此外,不同因子对收益率的影响存在着共同因素,使用单个指标构建因子会受到数据噪声的干扰;且单个因子的显著性在不同的历史时期也不尽相同。在多个因子基础之上构建综合因子自然成为一种选择。聚类分析是一种非监督机器学习技术,可以在标记信息未知的前提下,将数据集中的样本划分为若干个通常不相交的子集,使得同一子集中的对象具有相似的特征,而不同子集之间的特征存在差别。本文利用中国A股上市公司数据,采用聚类分析技术挖掘异象因子间的共性,并依据分析所得的两个聚类构建了聚类因子F1和F2。第一类因子F1中含有7个基础因子,包括企业经营状况相关的指标等;第二类因子F2中8个基础因子,包括相对估值指标和投资成长性指标等。对聚类因子F1和F2进行Fama-Macbeth回归分析,结果显示F1和F2对股票收益具有显著解释力。在加入了控制变量之后,F1和F2对股票收益率的回归系数依然显著,且符号不变。为进一步验证上述发现,本文将F1和F2因子加入原有定价模型中,构建了包含市场超额收益因子、规模因子、F1因子和F2因子的四因素模型,并对原有15个因子组合进行回归分析。实证结果显示F1和F2因子确实发掘了各因子之间原有定价模型无法解释的信息,且相比于原有的经典模型,对异象具有良好的解释能力。本文在稳健性检验中使用不同的方法对15个异象因子进行聚类,所得结果没有本质区别,实证结果稳健。本文的实证结果对原有因子定价模型在我国的适用性提出质疑和补充。现有模型无法解释F1和F2组合的收益来源,且实证结果证实F1和F2较高的股票β系数较低。相比于原有的经典模型,聚类因子模型对异象的解释能力更强。此外,本文认为在实际市场中,由于投资者的非理性行为和融资约束,高β的股票值较低。