基于Shap值拆解因子的机器学习选股策略研究

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:zyyhky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国经济迅速发展,居民在完成财富积累的同时,对于理财的需求逐渐扩大,国内多层次资本市场体系的建立建全,也为国内投资者创造了良好的投资环境。在这种背景下,投资者对于投资方法的研究也更加深入。量化投资凭借其客观性、准确性和时效性等多种优势,从众多选股方法之中脱颖而出,成为投资领域的热门话题。随着大数据与人工智能技术的进步,越来越多的投资者开始尝试将机器学习算法的思想应用在实盘选股中,为量化投资领域贡献了众多优秀策略。本篇论文以2015年1月1日至2021年1月31日沪深300成分股的全部交易日数据为研究对象,选用包括财务因子、规模因子和行业因子在内共计30个因子作为因子池,以LightGBM为主要方法建立选股模型。其中,采用2015年1月1日至2019年12月31日的股票数据作为训练集,建立预测模型,采用2019年1月1日至2021年1月31日的股票数据作为测试集,对模型的预测结果进行评估。通过建立模型,尝试研究以下问题:(1)利用集成学习模型LightGBM选择股票效果分析;(2)使用SHAP方法对黑盒模型进行事后归因分析;(3)结合模型预测效果以及归因分析结果,提出合理的投资建议。首先,论文以股票下月涨幅是否能够超过沪深300指数为预测目标,采用LightGBM算法建立选股模型,并利用网格搜索法对模型参数进行调优。确立以精确率为调参方向,最终模型具备60%左右的预测精确率以及65%的预测准确度,引入模型后投资者选股收益率超过沪深300指数收益率的可能性提升了25%左右,实盘回测收益也超出基准收益。其次,论文利用SHAP方法对选股模型进行事后归因拆借。拆解结果表明每股盈余、净资产收益率、营收同比增长率、流通市值这四种因子对于模型预测结果的影响最大。直接利用上述四种因子建立选股模型的预测效果同利用因子池内全部因子建模的预测效果相比,差异较小。最后,根据建模结果以及对于模型的事后归因,可以得出结论:投资者可以通过持有高每股盈余、高净资产收益率、高营收同比增长率的股票,辅以灵活科学的交易策略,达到获取超越指数收益的目的。
其他文献
21世纪初至今,中国企业经历了通过搭建红筹及VIE架构前往境外上市,再到通过私有化退市、借壳上市、二次上市及双重上市回归中国资本市场的历程。在我国金融体系改革深化和资本市场注册制发展的大背景下,是否该“走出去”及如何“走回来”成为了中国企业上市时首要考虑的问题,其中既有着机遇,但是也存在着巨大的挑战。在全球资本市场风起云涌的背景下,分析中国企业的选择以及中国资本市场的发展道路对我国经济金融市场的发
学位
基础设施建设作为我国经济发展中的重点之一,一直以来都承担着作为经济建设基石的重任。自改革开放以来,我国在基础设施领域形成了大量的优质资产,积累了大量的沉淀资金,但基础设施建设仍长期面临建设周期长、资金回笼慢、社会资本难以参与和酝酿地方政府债务风险等问题,并且受近年来整体经济增速放缓影响,我国基础设施资产增速放缓,逐渐步入存量时代。然而在脱离了经济高速增长模式的情况下,我国持续发展对于基础设施的需求
学位
随着我国人均可支配收入得上升,越来越多居民的开始选择多元化配置自己的资产。在资产种类的选择中,权益类资产由于其本身具有高风险高收益的特性,吸引了众多投资者的青睐。同时,资金流入权益市场之中,能够大大的提升我国资本市场的活跃性,有助于提升我国资本市场直接融资比例,并且帮助人民享受经济发展带来的红利,实现共同富裕。但由于我国证券市场本身发育的并不完善,加之众多散户投资者并不具备专业的投资能力,甚至不具
学位
随着国家政策的推动与市场环境的变化,房地产市场的新增长点——租赁住房市场成为了人们讨论的焦点。在政策推动下,各城市相继出台保障性租赁住房投资建设规划,期望从住房角度引进人才、促进经济发展。然而,保障性租赁住房在经营过程中也暴露出了诸多问题,例如投资规模大、投资回收期长等,仅依靠地方政府直接注资效率低下,亟需新的融资手段。而房地产投资信托基金(REITs)作为房地产市场的创新型融资手段,有用于保障性
学位
经典的资本资产定价理论中假设了市场是有效的以及投资者是完全理性的,在这个理想市场中,只有系统性风险可以获得风险补偿,而非系统风险则可以通过构建投资组合,分散化投资加以规避。规避非系统性风险的关键是投资者需要持有模型设定的市场组合,而由于市场中的信息不对称等因素,加上我国特有的卖空限制、涨跌幅限制等限制因素。市场组合的构建几乎是不可能的,因此有学者提出非系统性风险也应当提供风险补偿,学术界还因此争论
学位
随着我国房地产行业的过度繁荣,负面效应也逐渐凸显。2020年以来,监管部门制定“三条红线”等政策,房地产市场受到了前所未有的严格监管。监管政策的出台使得房企基本面发生了较大变化,大量债务违约、房企股票价格剧烈震荡,即使是优质房企,其市场表现也不尽如人意。当前背景下,如何科学的对房企进行估值、了解房企价值驱动力是投资者和房企管理层需要解决的问题。首先,本文通过梳理已有研究文献,形成理论框架,并归纳、
学位
配对交易策略是一种市场中性的绝对收益策略,其基于统计套利找出资产价格走势趋同的两种资产,当两者价差出现偏离时,做多价格走弱的资产,做空价格走强的资产,在未来两者价差回归到均值附近时,获得资产价格收敛的收益。目前对于中国证券市场的配对交易策略研究大多集中在从各大指数中挑选成分股作为股票池,例如沪深300、上证50等,没有完全覆盖所有证券,错过了许多投资机会。因为配对交易策略需要构建股票多空组合,所以
学位
2020年以来,全球新冠疫情的反复对世界经济造成的负面影响持续加深,政局不确定的风险有逐渐加大的趋势,中国经济和社会发展的外部环境也发生了显著的变化,这些情况促使我国在经济领域实施新的经济发展战略,努力塑造“双循环”的宏观经济发展新格局。在推进“供给侧”改革、构建经济双循环新局面、促进制造业健康有序发展的过程中,工业软件及相关产业的发展具有举足轻重的作用,而且是机遇和挑战并存。一方面,国内工业软件
学位
股权质押是指出质人以股权作为质押物出质给质权人以获取资金的行为,具有操作便捷、流动性强等特点。在金融脱虚向实背景下,传统股权债券融资方式逐渐遇冷,筹资成本不断上升,越来越多的公司采用股权质押的方式进行融资。但由于股权质押所获取的资金与公司股票价格相关联,会造成企业市场风险的增加。当股价跌至平仓线后,若出质人未能及时补充质押,质权人可能会在市场上抛售出质人的股权。而控股股东的股权一旦在市场上被抛售,
学位
上交所及深交所于20世纪90年代初分别成立,为我国证券市场投资拉开了正式的序幕。随着我国改革开放的不断深入。我国的股票市场也愈发成熟,投资活跃度不断提高,因此我国企业对融资方式的选择也从之前的间接融资慢慢的转向了直接融资,越来越多的企业选择在股票市场上市来进行股权融资。国家也因地制宜,针对不同类型公司的上市需求,开设了主板、创业板、科创板等多个市场板块来满足各行各业的上市需求。近年来,随着我国老龄
学位