基于XGBoost的多因子选股模型研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:cramzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国证券市场的发展不断完善和量化投资技术发展的双重推动,量化投资逐渐受到国内投资者,特别是机构投资者的重视,很多机构投资者也逐渐开始成立以量化投资为主要投资方式的基金产品。虽然如此,量化投资在我们证券投资市场的比重还相当小,其一是量化投资市场规模小以及量化策略表现不稳定;其二是量化策略存在一定的趋同性。因此,研究新的量化策略模型对于量化投资在中国的发展显得尤为必要。本文使用2011年至2020年沪深300成分股股票的财务、红利、规模、估值、质量等因子,有效的利用了股票市场上的交易数据,基于统计学习方法中的XGBoost算法进行多因子选股模型的构建,采用滚动训练的方法构建动态选股模型,获得了高于基准的超额收益。与此同时,本文将XGBoost、随机森林和支持向量机算法进行理论与实证对比,结果显示,从正确率ACC以及AUC值来看,XGBoost模型胜于支持向量机、随机森林对照模型。从模拟回测组合收益率指标和风险指标来看,虽然XGBoost模型信息比率和calmar比率高于其他模型,但是其最大回撤率却要高于支持向量机。为了降低XGBoost算法的最大回撤率,本文加入止损条件对模型进行优化来减少整体市场宏观因素的影响,减少干扰,经过测试结果表明,加入止损条件前最优的组合收益率为92%,而最大回撤率达到42%,加入止损优化条件后,最大回撤率有了明显下降(从42%下降到39%),年化收益率由原来的11.87%上升到17.40%,优化效果明显。综合而言,基于XGBoost的多因子选股模型可以获得更高的收益,回测效果较为稳定,虽然最大回撤率较大,但也可以通过止损优化方式克服,从而得到一个较为完善的投资策略。
其他文献
随着科学技术的不断发展,不同领域之间技术的相互渗透有利于解决各个领域内存在的问题,其中计算机技术的进步为推动我国金融市场发展及解决金融领域的学术难题做出了非常大的贡献。近年来,“智能投顾”等名词的出现标志着机器学习技术被积极且广泛地应用于投资组合管理的领域中,其中,机器学习技术中的集成学习为投资组合选择问题提供了解决思路及技术支持,集成学习可以结合不同的基学习器,该方法利用组合多个学习效果较差的弱
细胞约20%-40%体积都充满DNA、蛋白质等生物大分子,DNA在遗传信息中的调节作用至关重要。大分子拥挤效应对DNA分子间相互作用、基因表达等影响显著且机制尚不清楚。而随着单分子生物学的兴起,生命过程在单分子层面上的研究得以发展。因此,本文基于单分子磁镊技术在单分子水平探究大分子拥挤效应对DNA杂化过程的影响。基于DNA hairpin结构及磁镊子技术,利用与DNA hairpin颈部碱基互补的
随着数字经济的快速增长,乡村经济的数字转型趋势也日趋明显。中国数字乡村战略体现时代前沿和现实关切,其中发展乡村数字经济是数字经济理念与数字乡村建设的结合,需要正确理解并进行科学评价。本文通过建立乡村与数字经济之间的联系,赋予数字经济乡村属性。在对国内外相关文献梳理的基础上,对乡村数字经济概念进行界定,辨析“乡村数字经济”与“数字乡村”、“互联网+”农业等相近概念。很显然,“数字乡村”是比乡村数字经
金属铜因其良好的化学和物理特性而得到广泛应用,我国铜消费总量已经占到世界铜消费总量的二分之一,成为世界第一大铜消费国。金属铜价格的剧烈波动会增加市场的不确定性因素。正确预测铜收益波动性有助于市场参与者的风险管理以及国家政策的制定。在以往文献基础上,本文创新性地的将Kristjanpoller和Hernández(2017)提出的用于铜市波动预测的ANN-GARCH模型,以及林杰和龚正(2018)用
2000年以来,中国化工行业经历了一轮快速增长。中国市场所呈现的容量大、发展潜力大的特质,吸引着越来越多的外资公司来中国市场发展,中国市场已经成为跨国化工企业扩大全球影响力的必争之地。面对激烈的市场竞争,作为致力于成为全球化工行业巨头的外资公司M公司,必须在短时间内以领先业界的客户服务赢得客户口碑,树立良好的品牌形象,而这些都要以一个业界领先的优秀客服团队为基础。要想打造这样一个客服团队,M公司必
集成电路产业作为现代新兴信息技术产业的重点和核心,是支撑国家经济发展和保障信息安全的重大战略性、基础性和先导性产业。自2000年以来,国家便出台多项政策鼓励和支持集成电路产业的发展,并多次在政府工作报告中提到提升集成电路自主创新能力的重要性,把其发展上升至国家战略层面。经过多年的发展,我国集成电路产业的生产制造和技术自主创新能力都有了很大程度的提升。然而,近几年来美国打压华为和中兴、限制芯片出口等
近年,随着教改的不断深入,数学课堂的教学方法和思想也在不断地改进,数学课堂应当以学生为主体,教学思路要培养学生的数学核心素养,培养学生运用数学,分析实际问题、解决实际问题的能力,而不单单是解题能力。同时,反三角函数作为高中阶段一个在教学上和学习上都具有一定难度的内容,也值得一线老师深入研究如何才能够更好地让学生理解和运用反三角函数内容。为了能够同时实现培养学生数学核心素养、为学生进行学法指导以及更
在科学技术的推动下,消费者对当今生活品质提出了更高的要求。在设计过程中,用户始终处于核心地位,用户的市场地位已从被动接受转变为主动选择,逐渐成为市场的决策者,如何有效满足用户内心真实感性需求,是设计领域研究关注的重点问题,也是各企业关注的核心问题。通过观察、访谈、问卷调查等传统用户情感测量方式,往往易受设计师主观因素和用户自身内省能力干扰,难以精准地、客观地表达内心真实想法,随着数字化、信息化技术
2019年8月,中国人民银行发布公告,提出改进贷款市场报价利率(即LPR)形成机制的六大措施,以期增强市场利率传导效率,真正降低实体经济融资成本,切实解决利率“双轨”问题,从而进一步推动利率市场化。新机制下,利率单边并轨,贷款利率在不断下降,但存款利率依旧“刚性”。商业银行存贷利差不断收窄的同时,同业竞争进一步加剧,利率风险、经营风险逐渐扩大。因此,深入研究LPR报价改革背景下,商业银行经营绩效水
在我国农业发展、农村建设和农民致富等领域中,农村商业银行作为当前我国最重要的农村金融机构,一直扮演着其他金融机构无法替代的角色。目前而言,农村商业银行的贷款体系中占比最大的为涉农贷款,因此只有更深层次地对涉农贷款风险进行研究,才能使贷款风险得到有效降低。涉农贷款是一类主要涉及农业种植、生产、加工和运输的贷款。根据不同的贷款对象,涉农贷款可以划分为城市涉农企业及组织类贷款、农村涉农企业及组织类贷款和