基于TabNet的多因子选股交易策略研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:chengczl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国内的金融开放及科技发展,人们在投资分析时不仅仅局限于传统基本面和技术分析,基于数据和规则的量化投资的应用开始逐渐兴起。因子投资则是量化投资的一个热门研究方向,近两年,机器学习算法与多因子策略结合的方向进行了一些研究,但还远不完善,存在着策略未能充分利用因子信息、投资策略常陷入过拟合、可解释性较差等问题。本文针对现有因子筛选及策略模型中存在的问题,在现有相关因子投资研究的基础上,构建了基于独立双重排序的因子筛选方法,并使用基于改进后的模型S-TabNet对多因子投资与机器学习相结合的投资方式展开研究。主要工作如下:1.针对当前因子筛选方式较为简单、信息利用不够充分的问题,提出一种基于双重排序和显著性指标的因子筛选方法。因子的筛选问题是能否充分利用因子信息的关键,对主流论文发表的198个因子构建因子库,并依此构建了一个基于双重排序和显著性指标的筛选因子的方式,来鉴别因子的好坏。该方法相比以往研究方法不但更多的考虑因子收益率,而且有效的改善了独立双重排序筛选方法中选股不平衡的问题。2.针对目前传统机器学习方法容易过拟合和解释性较差的问题。本文使用通达信、Tushare等工具获取股票数据,并对其进行预处理;其次,使用优化过的模拟决策树过程的模型S-TabNet对筛选后的股票因子数据进行处理,进而用于股价预测分析。最后,融合RSRS风控系统,对预测结果的波动性进行有效控制,从而形成选股交易策略。实验表明,该方法相比传统因子投资及目前主流的因子投资方法更为有效,可解释性及过拟合问题也得到改善,同时S-TabNet也改善了TabNet时间复杂度较高的问题。3.本文构建了一个基于S-TabNet的多因子投资交易系统。原型系统以因子和A股数据作为基础,结合S-TabNet对股票进行筛选并获得建议买卖股票列表。该系统为本文提出的方法提供了可行性和有效性实验验证环境,也为后期实用系统的开发提供了参考。
其他文献
随着大数据时代的到来,人工智能技术在许多领域发挥了重要作用,与此同时,人工智能安全问题逐渐凸显。机器学习模型作为人工智能系统的核心,其安全性也成为工业界和学术界关注的热点。自对抗样本的概念提出以来,针对机器学习模型的各种攻击层出不穷,现有攻击算法无法很好地兼顾攻击成功率和样本视觉效果,为了达到较高的攻击成功率而不惜对原始图像进行大规模像素修改,导致最终生成的对抗样本失真。并且大多数情况下对抗攻击算
学位
图像是21世纪最重要的信息传播媒介之一,具有简洁且迅速的视觉信息传达能力。图像补全是数字图像处理领域的一项重要研究内容,目前的研究方法大多基于深度学习构建模型。然而,现有的图像补全技术仍存在一些不足,一些方法忽略了图像的边缘结构信息,在补全大面积不规则的缺失图像时无法还原高清晰度的结果;普通的局部判别器只能输入规则的缺失图像,不能补全非矩形的缺失图像,不具有普适性;另外一些方法没有注重生成结果和背
学位
期刊
随着互联网时代到来,数据流量需求伴随设备数量增多而爆炸式增长。为了满足流量需求,异构无线网络通过大量部署小型化设备,来提升网络容量。但这种超密集部署方式增加了终端接入的随机性,使得网络性能易被外界因素影响。更有甚者,事故、新闻事件和娱乐活动等突发事件带来的聚集终端,会导致网络局部负载快速增加,使得网络拥塞,影响终端通信。对此,本文以缓解或规避网络拥塞、提升聚集终端服务体验为目标,从提前预警采取控制
学位
稳态视觉诱发电位(Steady state visually evoked potential,SSVEP)是常见的脑机接口(Brain Computer Interface,BCI)范式,它是当人体收到固定的闪烁频率刺激后,在大脑后枕部区域产生的与刺激频率相关的一种EEG信号,其频率和刺激目标闪烁频率及谐波频率高度相关。由于其采集方便、信息传输率高等特点,SSVEP受到了研究人员的广泛关注。为了
学位
随着卫星传感器的迅速发展,遥感卫星为遥感应用研究提供了丰富的遥感影像。合成孔径雷达(Synthetic Aperture Radar,SAR)图像和多光谱图像在对地监测方面具有互补的优势。其中,SAR能在各种气候条件下提供具有丰富空间细节特征的图像,但其图像缺少光谱信息。而多光谱图像属于光学图像,具有多个光谱段,但它易受大气环境影响降低了空间解析能力。因此,利用融合技术将多光谱图像和SAR图像互补
学位
分类是一种有标签的机器学习,属于监督学习中的一种,在分类中经常会遇到类别不平衡的数据集。类别不平衡导致分类结果会偏向于多数类,对少数类的识别精度不高。现实中的数据集通常包含被错误标记的标签,这种包含错误标签的样本被称为标签噪声。标签噪声会造成决策边界偏移,降低模型的预测性能,增加模型的复杂程度。当不平衡数据集中存在标签噪声时,会给分类器造成较大的负面影响。采样是一种解决类别不平衡的方式,它通过增加
学位
在互联网时代,数据正在以非凡的速度呈现超高速增长,如何有效地从繁杂无章的大数据中挖掘有价值的信息与知识是人工智能技术的一个重要研究目标。在粒计算领域,序贯三支决策作为三支决策思想的延伸,在处理不确定信息时起到重要作用。序贯三支决策除了引入了延迟决策,能够在信息不充分时做延迟决定,降低决策带来的损失,还具有一种渐进的思维。其通过循序渐进地获取信息来将空间的粗粒度转换为细粒度,能够很好地解决生活中的各
学位
产前超声检查中胎儿心脏标准平面的确定对于医学超声诊断至关重要。医生获取胎儿心脏标准平面通常需要对胎儿心脏解剖学有透彻的了解和丰富的经验,对于没有经验的医生来说非常具有挑战性,对于临床专家来说是耗时的。设计一个好的分类模型定位胎儿心脏标准平面有助于提高专家的效率。目前已有的胎儿心脏标准平面分类模型都是人工设计的网络结构,网络的体系结构参数是复杂的、离散的、无序的。为了获得一个有效网络模型需要从深度、
学位
报纸