基于集成算法的多因子量化选股模型研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:beichensi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着IT技术的进步以及各种数学模型、算法理论的发展,量化投资已经成为资本市场中的主流投资方法之一,量化投资可以规避人性情绪化的弱点,帮助投资者从海量数据中寻找可靠的交易模式,从而获得超额收益。我国资本市场已经成长为全球主要资本市场之一,但量化投资的发展历史相较于美国还很短,目前有越来越多的学者和业内人士将海外量化经验应用到中国金融领域,各类量化基金的数量、规模不断增长,各种量化投资策略百花齐放,量化投资正经历着蓬勃发展的春天。本文梳理了国内外对有效因子、量化选股、集成算法方面的学术文献,发现虽然XGBoost、Light GBM等集成算法在环境保护、能源利用、信贷审批等领域取得了良好的学术研究成果并有着诸多竞赛实践应用,但将多种集成算法应用于中国A股市场进行量化选股,并对不同算法进行定性定量分析的研究却不多。因此,本文对基于集成算法的多因子量化选股模型进行了研究。截止2020年底,沪深300指数所包含的股票市值占中国A股总市值的57.34%,沪深300指数可以作为本文构建的投资组合业绩比较标准。本文以沪深300指数成分股为研究对象,收集2011年1季度至2020年4季度共十年的股票数据,时间跨度包含了完整的牛市、熊市、震荡市。在因子选择上,本文基于前人学者对美国长期有效因子进行系统性研究后得到的因子池框架,再结合多篇对国内A股市场有效因子探索的文献,在数据可获得的基础上构建了本文的因子池,包括动量类因子、价值成长类因子、投资类因子、盈利类因子、无形资产类因子和交易摩擦类因子,共98个因子。在算法选择上,本文从Bagging、Boosting和Stacking三种集成策略中分别选1至2种算法,共4种集成算法。对Bagging集成策略选用经典的随机森林算法,对Boosting集成策略选用较GBDT效果更好的XGBoost和Light GBM算法,对Stacking集成策略,本文在第一层使用了具有差异性且单体效果良好的随机森林、XGBoost算法,在第二层使用了Light GBM算法,构建了RXL-Stacking算法。本文以季度为周期,前6个季度为训练集,第7个季度为测试集,使用集成算法对历史数据进行滚动训练与预测。在算法生成的当前季度的候选股票清单中,股票按照能够战胜基准指数的概率降序排序,本文选取前k只股票按等权重的资金分配方式构建投资组合并回测,k??10,50,100,150,200?。由于有4种集成算法、5种建仓股票数量,本文共构建了20组投资组合。最后,从收益性和风险性角度对不同投资组合的业绩进行评价。本文研究发现:(1)4种集成算法中,只有少数参数能够提高算法性能,其余可以设置为默认值,且调参优化的作用有限,更应该从因子选取、数据预处理等角度提高数据质量以提升模型效果。(2)Light GBM算法在内存消耗和时间花费方面具有很大优势,而RXL-Stacking算法需要花费较多的时间用于调参,且运行速度较其他三种集成算法更慢。(3)4种集成算法在长期中均有较好的选股能力,RXL-Stacking算法的选股能力最佳,在34期滚动训练预测中的平均AUC值为0.644。(4)净资产收益率、总市值、过去3月换手率均值、市盈率、市净率等因子对模型的分类贡献较大,这些重要性较高的因子覆盖了各个因子类别,说明本文的因子池框架具有一定的合理性。(5)对于既定算法,建仓股票数量较少时投资组合业绩更好。对于既定建仓股票数量,RXLStacking算法构建的投资组合优于其他算法。当选用RXL-Stacking算法并且选取k=10只股票时,此时为最佳投资组合。在回测区间内,最佳投资组合的年化收益率、夏普比率、最大回撤分别为19.86%、1.46和28.55%,均优于沪深300指数的9.22%、0.23和32.69%。因此,本文构建的量化选股模型具有较高的分类能力和良好的稳定性,能够帮助投资者提高选股的准确性,获得更高的超额收益。
其他文献
证券分析师在一定程度上缓解了资本市场上信息不对称的情况,在投资者与上市公司之间搭建了一道信息桥梁。首先,分析师可以通过与公司管理层取得联系或者参加上市公司说明会等多种方式了解公司微观情况,然后结合市场环境和国家政策等宏观因素对外发布盈余预测报告、荐股评级等,帮助投资者做决策。因此,分析师行业对于从业人员的工作能力有一定的要求,是一个高门槛、高强度、高压力的行业,总体来看,该行业男性占大多数。但是,
近年来经济全球化进程受阻,世界经济呈现颓势加上中美贸易摩擦压力增大,我国经济发展的外部环境可以说并不理想,但我国经济依然保持着良性增长,随着我国经济结构的不断调整,经济发展也由高速增长逐渐转变为高质量增长。我国经济改革的其中一个重要手段即是利率市场化改革,发展至今日虽然制度上的发展已经较为完善,但是仍有尚未建立基准利率、多领域改革不协调等问题。从金融市场来看,债券市场的规模越发庞大,已然是支撑我国
在现实社会中,媒体容易受到商业利益和政治力量等多方面的影响,在信息筛选过程中,难以维持真实客观的职业标准,向社会公众提供有倾向性的新闻报道。本文从公司股权性质的视角出发,实证检验了深交所上市公司股权性质是否会对上市公司媒体报道产生影响。研究结果表明,深交所国有上市公司会多获得14.9%的新闻报道资源。在资产状况、经营成果、市值、内部控制规范程度相似的情况下,新闻媒体会倾向于多报道国有上市公司的信息
当前,新一轮科技革命和产业变革加速演进,强化我国的创新能力势在必行。党的十九届五中全会也已提出,我国要力争在2035年进入创新国家前列。因此,有效提升实体经济企业的创新能力,使其适应高质量发展要求,助力补足产业体系短板,是我国经济进入新常态发展阶段后的关键任务。如何有效地激发企业创新活力、维持持续创新的动力,一直是学界和业界广泛关注的问题。本文试图从企业投保董责险的视角出发,分析上市公司投保董责险
中国人自古以来就保持着劳动光荣的社会心理。就业权作为公民的基本权利之一,保护刑释人员的就业权就是保障民生。如果失去了就业权的保障,刑释人员作为“弱势群体”,在丧失竞争优势的情况下,很难实现自主就业。我国刑释人员作为一个庞大的社会群体,帮助其社会回归并参与就业,能达到降低二次犯罪率的目的,实现长治久安。保障刑释人员就业权,一方面能够巩固国家安全,另一方面帮助社会维稳,优化社会关系。于个人而言,这是刑
城投债,国内和国际上许多学者形象地将其称为中国的“准市政债券”。市政债券的发债方是地方政府。城投债则是一种按照一般债券类融资工具的发行规则发行、发行主体是具有政府背景的地方融资平台的特殊债券。正是由于这种特殊关系,市场在城投债的发行过程中往往会考虑地方政府的财政收入的影响,考察地方政府在城投债发行定价时承担的角色。本文主要研究在城投债发行定价时,地方政府财政收入结构对城投债利差的影响。尽管关于城投
近年来,金融市场在社会的经济活动中逐渐占据重要的地位,然而,普通的投资者具有很强的盲目性与从众心理,无法做出更为正确的投资选择。因此,研究如何将资产进行有效的组合从而得到更好的投资策略,具有十分重要的意义。本文主要提出了一种新的投资组合风险度量方法——投资组合模糊收益的不确定性。本文在数据的选择上是选取了上证300指数中的40支成分股作为本文进行实验的研究对象,同时在选择股票时也综合考虑了规模性与
随着2018年金融市场融资环境收紧,民营企业融资成本高、融资渠道少的问题开始凸显,许多民营企业陷入流动性困境。在市场行情持续低迷的背景下,一些通过高比例股权质押进行融资的企业因为持续下跌的股价不得不面临被强制平仓的风险。为熨平市场波动风险,国务院鼓励各地方政府及金融机构参与纾困民营上市企业的行动。东方园林在2018年面临着股权质押平仓风险,作为园林行业的龙头企业,在纾困政策推行之际自然而然就成为了
我国共享单车行业在经历探索期、爆发期和调整期后,于2018年因正式被国家监管而逐渐进入了正规化发展轨道,形成更加成熟的商业运营模式,迎来了市场的平稳期。目前,共享单车行业的市场份额主要被龙头企业占领,例如哈啰、青桔、美团,用户则主要集中在一线和二线城市。共享单车平台如何在巨头竞争中脱颖而出,留住老用户并且以自身独特优势吸引新用户,对其未来的持续性发展至关重要。基于此,本文深入发掘影响共享单车平台用
“三农”问题一直是我国重点关注的对象,中共中央、国务院在2021年“中央一号”文件中明确表示要提升重要农产品的供给能力,确保粮、棉、油等供给安全。油菜籽产业作为我国重要的油料行业,在经历临时收储制度市场化改革后,总产量出现下降趋势,农民的生产积极性也受到不同程度的影响。在当前的时代背景下,油菜市场面临着一些不可控因素例如新冠疫情,农产品产业链供给端有可能出现缺口,进一步使价格出现波动,这使人们更加