基于机器学习改进算法的股票型ETF量化投资策略研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:nan13519927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在国内外证券投资行业的不断发展进步中,量化投资在国内市场逐渐萌发。虽然国内量化投资行业发展起步较晚,但是借助国外成熟市场的先前经验与发展成熟的技术工具,有助于中国的研究者迅速跳过量化投资初期的摸索阶段,可以直接运用经过国外市场验证的、较为成熟的投资策略,逐渐发掘出与中国资本市场相匹配的量化投资策略。在计算机技术的发展进步中,人工智能、机器学习等新技术的应用也提高了量化投资模型的表现效果。中国量化投资行业仍有较高的研究价值。伴随着余额宝的诞生,中国公募基金行业迎来了飞速发展阶段,公募基金总规模实现了高速提升。由于监管严格执行去杠杆政策,银行理财不再保本且收益率持续下降,公募基金凭借公开透明、投资门槛低的优势为投资者提供更好的投资选择。但是,尽管公募基金取得了令人刮目相看的亮眼投资成绩,许多投资者却仍没有取得相应的投资收益,主要原因就是许多客户没有能够在合适的时点进行买卖。投资者往往更倾向于选择近期已经实现较高收益的基金购买,这些爆款基金可能在板块轮动中无法继续取得高收益,使得高位入场的客户陷入被套牢的困境。目前市场上的公募基金数量已经远远超过了股票数量,如何让普通投资者在市场中选择合适的基金并随市场走势动态的进行调整,从而实现基金公司与客户的双赢已经成为行业发展中不可忽视的一大问题。为了改变这一现状,从2019年底起,基金投顾的概念开始在中国开始崭露头角,众多头部银行、券商、独立销售机构以及基金公司均拿下了试点资格,意味着财富管理服务机构从卖方导向买方导向的转型,客户服务将从产品营销转向资产配置。改善业内过去主要通过基金销售环节赚取佣金造成的市场火热时基民追高的现象。基金投顾需要试点机构以大类资产配置为理论基础,通过以ETF基金为核心的公募基金作为底层资产,运用计算机技术与人工智能等创新科技来进行投资。如今的智能投顾业务试点,目的是促使金融机构发挥其投资研究上的专业性,从用户需求入手,确保用户真正实现资产增值。从国外较为成熟的理财市场来看,投顾模式是财富管理行业发展到一定程度的大趋势。因此如何从现有的上市ETF基金中选出具有投资价值的标的构建投资组合并可以对组合业绩进行合理评价,就是这些基金投顾试点机构首先需要解决的问题。由于ETF基金也可以在二级市场进行流通交易,因此,传统多因子选股量化模型在ETF筛选上也存在着一定的适用性。通过寻找与ETF基金收益关联度最高的一些因子,使得这些因子对于ETF基金未来收益具有一定的预测能力,从而可以构建投资组合,获得超越市场的收益。这些因子包括ETF基金本身具有的特殊因子以及通过其跟踪指数模拟的因子,对于ETF量化组合构建适用的因子的选择与筛选就成为了构建ETF量化模型中最重要的部分。本文选取2015年1月1日前成立的69只跟踪股票指数的上市交易型ETF基金作为基金池。ETF基金数据回测时间区域为2015年1月6日至2019年12月31日。在传统选股因子中寻找可以应用于ETF基金筛选的因子,其中包括ETF基金本身具有的特殊因子以及通过其跟踪指数模拟的因子,作为模型特征值。计算样本月度涨跌幅,将月度涨幅是否超过沪深300涨跌幅作为二元变量,当ETF基金能够获取超额收益记为1,反之标记为0,以此为样本标签输入模型进行分类预测。本文通过XGBoost算法构建对于ETF基金月度收益率是否能够取得超越沪深300的超额收益的分类预测,每月关于因子预测结果进行资产组合调仓,以期获得超越沪深300的收益。对于模型预测可以取得超额收益的基金,将资金在这些基金中进行平均分配,构建投资组合。基础模型建模完成后,本文还尝试对量化策略进行增强,在模型中加入了岭回归以及随机森林算法,运用bagging集成算法的思想对数据集并行训练并通过投票的方式得出最后的优化后模型。与原模型相比,新的优化模型在回测运行实现了投资收益率的提升。
其他文献
近几年来舆情反转现象频发,成为了新闻界热议的焦点,同时也引起了学界的关注。本研究结合社会学、传播学、心理学理论,采用定量与定性相结合的方法,选取鲍毓明性侵“女童”事件为个案,对舆论反转过程的舆情演化与情感演变进行分析。本文基于Python语言编写的爬虫爬取了有关鲍毓明性侵“女童”事件2020年4月1日至2020年10月30日的微博文本,最终共获得12670条微博文本数据,除此以外还得到发布微博的时
学位
2020年,新冠疫情在全球爆发。疫情的爆发引发了一场旅游行业的危机,并给中国及世界旅游业造成了巨大的影响。从短期来看,新冠疫情造成了全球人口流动骤减、全球旅游业收入大幅度下降。从长期来看,新冠疫情将旅游行业内的各细分行业原有的发展模式打破,旅游行业内部已发生或将会发生一些永久性、结构性、根本性变化。这一点使得新冠疫情区别于以往任何的旅游危机,如“911”恐怖袭击事件、SARS疫情等,因为后者持续的
学位
随着互联网行业以及信息时代迅速发展,用户产生的数据成倍增加,同时计算机储存技术日益成熟,计算机计算能力大大加强,使得越来越多的数据能够用计算机处理,蕴藏在数据中的价值也越来越多的被人们所关注。目前机器学习理论日趋成熟,大数据技术在各行各业中取得巨大进展,有力地推动了人工智能的发展。企业通过收集数据,基于机器学习理论,研究行为数据,从而提取有用信息为企业所用。基于以上背景,本次研究希望能根据历史数据
学位
《哲学的贫困》是马克思批判蒲鲁东主义的经典著作,也是马克思唯物史观、政治经济学、共产主义思想、科学方法论集中迸发的文本。在该文本中,马克思借助对蒲鲁东的批判将自己从《1844年经济学哲学手稿》到《德意志意识形态》中所取得的理论成果进行整合、论证和深化,不仅解决了之前著作遗留下的问题,也为后续《资本论》的写作提供世界观基础和方法论前提。《哲学的贫困》作为马克思思想发展过程中的重要理论环节,它的产生代
学位
我国为人均水资源缺乏国家,人均水占有量仅为世界平均值的1/4。随着人民生活水平的提高,总水耗持续增加,其中建筑生活用水量占到城市总用水量的60%,建筑节水的重要性愈发显现。当前我国对于建筑水耗进行管控和评估的方法并不多,常用方法是国家和各省市制定的建筑用水定额标准,但随着社会高速发展,用水定额标准的更新往往跟不上用水需求的增加,同时用水定额标准的使用需要建筑有分项计量数据,实际操作难度较高。国外用
学位
马克思的思想体系是直接建立在对现实的理解之上,因此马克思的现实观在马克思的思想体系之中占据着至关重要的位置。但是当下人们对于现实的理解却处于这样一种明显的对立之中:一种是对现实做形而上学的理解,另一种认为现实就是单纯的经验实存,将现实等同于“事实”或“现象”。破除这种对立状态,需要我们真正理解马克思的现实观,同时,对马克思现实观的正确理解本身在理论意义上既能凸显马克思主义哲学关注重大社会现实的精神
学位
“瞪羚企业”的概念最早由美国麻省理工经济学教授戴维.伯奇和詹姆斯.麦道夫于20世纪90年代提出。它是指大量穿越创业死亡谷的,经历完整初创阶段(雏鹰企业),进入快速发展阶段,并有机会进入行业领袖阶段(独角兽企业),继而发展为成熟稳定的地区和细分领域龙头的企业。当经济发展壮大到一定阶段,根植性龙头企业在地方经济中充当稳定器的作用。但从实际工作中看,一般来说,此类企业的存在多数情况下只能靠本地培育,如同
学位
近些年来,尤其是2016年谷歌的Alpha Go与韩国李世石的人机围棋比赛,使得深度学习、神经网络等等技术被越来越多的人所熟识。而在图像识别、音视频识别处理、自动驾驶等领域,得益于众多学者不断的研究与探索,深度学习的发展取得了巨大的进步。目前,已有众多研究人员将深度学习、神经网络等技术运用到金融时序数据的预测中,如预测股价涨跌、期货收益等等。这是因为随着全球经济的迅猛成长,经济全球化也是未来发展的
学位
全球范围来看,橡胶期货的交易基本上汇聚在三个交易所,其中新加坡占据了举足轻重的地位,该领域上海也领先于东京。其中天然橡胶品种,上海取得了一些优势,在全球同类合约中排名首位,对上海国际金融中心建设起到了一定的促进作用。在天然橡胶期货市场逐渐成长的过程中,金融监管部门(包括上海期货交易所)、橡胶期货相关金融企业、橡胶产业上下游企业、个人投资者等市场主体也逐渐壮大。我国作为全世界最大的发展中国家,网民规
学位
多因子选股作为量化投资研究领域的经典模型,在海内外各类投资机构均受到广泛研究和实践应用。在国内,自2010年沪深300股指期货上线以来,以多因子选股为代表的阿尔法对冲策略也逐渐走入了公众的视野。20世纪90年代,前瑞银华宝证券全球首席策略分析师Edward Kerschner提出事件驱动投资策略后,该策略已经发展成与行业配置并驾齐驱的策略研究和资产配置方法。事件驱动研究的本质仍然是对市场参与者内心
学位