基于机器学习分类算法的分市值选股策略

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:wjln123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个全面数字化转型的时代,量化投资在投资领域中占据着越来越重要的地位。而机器学习分类算法在人工智能快速发展并得到应用的同时,无疑通过其刻画复杂关系和挖掘数据规律的能力,为构建量化投资选股策略助力良多。在市值轮动的背景下,利用机器学习分类算法针对性的刻画不同市值场景下的股票收益特征,并不断提升算法的有效性和合理性,以构建具有收益性和稳定性的投资策略具有现实意义。本文首先结合量化投资、机器学习和市值分层的发展历程、当前背景与现有研究提出研究问题,归纳研究意义,简述研究方法,确定主要研究内容是不同市值类型的股票基于机器学习分类算法的选股策略构建及有效性研究。接着,对多因子选股、机器学习分类算法和市值分层的模型基础进行介绍。最后,通过厘清多步细节确定模型结构和构建平均参数首层策略,并基于Python进行策略回测,从收益性和稳定性两个方面对大、中、小市值股票下的选股策略进行有效性对比,并进一步做经济学含义解释。本文以2011年4月30日至2021年9月30日的中证100、中证200和中证500指数净值及其成分股的38个因子数据、中信一级行业标签与月度收益率作为研究数据。首先,对因子数据进行去极值、补空值和标准化的特征处理;其次,基于IC筛选和共线性筛选最终保留26个有效因子;接着,基于GBDT、XGBoost和BNN算法搭建选股模型;之后,通过划分验证集在数据集上进行模型参数遍历寻优;最后,以随机划分10%和牛熊市切割的验证方式结合真实标签与前后50%标签的参数设置构建平均参数首层策略。策略回测结果显示,综合年化收益率、年化波动率、夏普比率、最大回撤、评分均值和评分标准差,相对指数基准,对于大市值股票:强烈推荐GBDT策略,中度推荐XGBoost策略,不推荐BNN策略;对于中市值股票:强烈推荐GBDT策略和XGBoost策略,不推荐BNN策略;对于小市值股票:强烈推荐GBDT策略和XGBoost策略,轻度推荐BNN策略。结合分层回测、多空组合和年度收益分析策略表现,发现BNN策略在熊市表现较好,而GBDT策略和XGBoost策略在牛市表现较好。基于SHAP框架进一步分析得出,每股收益、销售毛利率、总资产增长率、应收账款周转率和资产净利率是排名前五的重要因子,在预测时贡献度较大。
其他文献
股权质押是指出质人以股权作为质押物出质给质权人以获取资金的行为,具有操作便捷、流动性强等特点。在金融脱虚向实背景下,传统股权债券融资方式逐渐遇冷,筹资成本不断上升,越来越多的公司采用股权质押的方式进行融资。但由于股权质押所获取的资金与公司股票价格相关联,会造成企业市场风险的增加。当股价跌至平仓线后,若出质人未能及时补充质押,质权人可能会在市场上抛售出质人的股权。而控股股东的股权一旦在市场上被抛售,
学位
上交所及深交所于20世纪90年代初分别成立,为我国证券市场投资拉开了正式的序幕。随着我国改革开放的不断深入。我国的股票市场也愈发成熟,投资活跃度不断提高,因此我国企业对融资方式的选择也从之前的间接融资慢慢的转向了直接融资,越来越多的企业选择在股票市场上市来进行股权融资。国家也因地制宜,针对不同类型公司的上市需求,开设了主板、创业板、科创板等多个市场板块来满足各行各业的上市需求。近年来,随着我国老龄
学位
近年来,我国经济迅速发展,居民在完成财富积累的同时,对于理财的需求逐渐扩大,国内多层次资本市场体系的建立建全,也为国内投资者创造了良好的投资环境。在这种背景下,投资者对于投资方法的研究也更加深入。量化投资凭借其客观性、准确性和时效性等多种优势,从众多选股方法之中脱颖而出,成为投资领域的热门话题。随着大数据与人工智能技术的进步,越来越多的投资者开始尝试将机器学习算法的思想应用在实盘选股中,为量化投资
学位
银行业在我国股市板块和金融体系中均具有重要地位。在股市板块中,银行业已经成长为A股市值权重最高的板块,流通市值占比高于10%。在金融体系中,我国金融体系以银行业为主体,主要通过银行信贷间接实现资金的融通,因此银行业对其他行业具有较强的风险溢出效应。分析银行业风险承担行为对股票价格的影响,不仅可以构建择时因子为资产组合配置提供参考,更具有监管和政策启示性。本文基于2007年至2020年我国A股上市的
学位
自2015年对中资美元债的发行由审批制改为注册制后,中资美元债的发行进入了高速发展期。2017-2021年中国企业共发行1980只美元债融资8058.66亿美元,成为中国企业一个重要的融资渠道。然而随着美元债发行规模的不断增大,其风险也在不断增加。2018年-2021年共有44家企业发行的71只美元债违约,违约金额达到262.92亿美元。房地产企业作为美元债发行规模第二大的行业,违约金额更是处于高
学位
2020年初的疫情对世界经济造成了巨大冲击,德尔塔、奥密克戎变异毒株的高传染性和隐秘性又给预期的经济复苏蒙上阴影;国内外部环境不断恶化,中美摩擦不断加剧,除去政治摩擦外,两国经济摩擦也愈发频繁,美国对中国高端科技企业的制裁也愈演愈烈。面对诸多困难和挑战,中小企业面临极大的生存压力,解决的唯一方式是促进实体经济发展。而实体经济是由众多产业供应链组成的一张大网,增强实体经济的韧性和活力的关键点在于提高
学位
债券融资在我国金融市场占据核心地位,规模巨大。自2014年首次出现债券违约以来,该现象在我国成为常态。2021年,陆续有多家房企违约,包括华夏幸福、蓝光发展等,房产巨头恒大也处于非常危险的位置。在国家加强对房地产管控,叠加疫情爆发影响企业正常经营的情况下,对于房地产企业的违约风险研究尤为重要。本文以2021年7月12日,蓝光发展发行的“19蓝光MTN001”为例,剖析蓝光发展债券违约的背后原因,并
学位
2021年6月份,我国首批公募REITs上市交易,这是我国REITs市场一个新的里程碑。公募REITs作为一种公众对于不动产领域的投资产品,具备投资门槛相对较低的特点,符合目前阶段我国发展的要求,也为公众提供了除股票与债券之外的另一种投资工具。首批公募REITs的上市为研究其投资价值提供了契机,本文选取其中浙商证券沪杭甬高速REIT作为案例,通过对该案例进行具体分析,来研究我国公募REITs的实际
学位
创新药行业作为医药领域近几年快速发展的细分行业,属于国家重点支持的战略性新兴产业之一,再加之其在肿瘤、自身免疫、心血管等领域疾病中出色的表现,使其备受资本市场关注。港股上市标准的改革以及科创板的推出,让未盈利创新药企业也能通过股票市场进行融资。但随着而来的是创新药企业的估值问题,上市首日破发、股价大幅波动等成为了困扰投资者的首要难题。基于这样的背景,本文试图构建一套适合未盈利创新药企业的估值模型,
学位
2021年6月21日,我国首批权益型公募REITs正式落地,这是我国资产证券化市场经历了近三十年的REITs探索后的尝试。一路走来,我国资本市场呈现出了监管主导的市场结构,反映在资产证券化产品交易结构上为以“银行间协会-银行间市场-信托计划-私募基金-基础资产”和“证监会/中基协-专项计划-私募基金-底层资产”为代表的具有REITs属性的产品。公募REITs选择了证监会条线结构,这是市场发展历史决
学位