论文部分内容阅读
近年来,量化投资凭着其纪律性、系统性、及时性及分散化的特点,日益受到机构投资者和对冲基金的重视。同时,我国证券投资市场的规模和证券开户数都在迅猛的增加,从我国证券市场有效性和国外证券市场的发展经验来看,量化投资的发展前景毋庸置疑且值得期待。尽管如此,目前国内量化投资产品依然存在总体规模小、量化策略单一、策略业绩分化等缺点。此时,研究新的量化投资方式和挖掘新的建模思路的重要性对于丰富量化投资产品,提升市场规模,推动量化投资的发展意义重大。在众多的量化策略中,多因子选股策略凭借其稳定性和覆盖广等优势被许多研究者关注。多因子选股量化策略方案主要致力于解决多因子的选取够全面,其次是分类模型有良好的泛化能力,基于此两大方向,本文都进行了一定的优化和改进,其一本文首次相对全面的搜集了因子数据,除了大部分研究者使用的财务、红利、动量等因子,总共使用了307个因子,我还加入了规模、估值、宏观、债券和楼市相关因子;其二本文首次使用较为新颖的XGBoost提升算法,此算法的主要优势是:XGBoost支持线性分类器,而且自带L1和L2正则化项的逻辑回归或者线性回归。其次,XGBoost在代价函数里加入了正则项,使学习出来的模型更加简单,防止过拟合;最后,XGBoost借鉴了随机森林的做法,支持列抽样,不仅能降低过拟合,还能减少计算,并且XGBoost工具支持并行,速度较快。并比较了SVM、随机森林和XGBoost三种算法的优缺点和建模交过对比,证实XGBoost算法效果和稳定性最好;其三,本文改变了以往的因子筛选方式以及建模流程,使用边训练边筛选的方式,筛选的方法更为科学合理。基于以上策划思路,最后成功设计出了利用机器学习的方法量化选股,并取得了超越沪深300指数的超额收益率的多因子量化选股方案,经过23个持有期所选出的股票组合的总收益为287%,年化复合收益率高达127%,夏普比率为0.91,信息比率为2.41,有82%的季度跑赢沪深300指数,有59%的季度取得正收益,最后净值达到3.87,远超基准沪深300指数收益率。