基于随机森林算法的多因子量化选股方案策划

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:jialei2055000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在金融市场中,如何获取较高的收益率,一直是投资者和投机者们分外关心的问题。量化投资理论因其与数学高度结合,具有高度的纪律性和系统性,已经成为国外的主流投资策略方案。近年来,随着人工智能的出现,机器学习也逐渐进入学者们的视野,其中,决策树和神经网络已经被一些学者们用来解决经济学问题,而更多的机器学习算法和量化投资的结合,是未来发展的新趋势。在美国量化投资30多年的发展史中,量化投资在目前美国二级市场的成交量占比达到将近80%,基金经理们通过挖掘市场信息构建数量模型,进而选择股票组合,赚得盆钵体满。其中世界上著名的文艺复兴科技公司的“大奖章对冲基金”的年均回报率高达34%,且发挥稳定。与美国已经成熟和完备的量化投资市场相比,我国的量化投资开展地较晚,但发展速度迅猛,存在着很多可以挖掘和提升的发展空间。根据2017年12月底的报道,我国A股市场已居世界第二位,在日均换手率,也就是流动性方面稳居第一位。但同时,在世界对冲基金总规模3万亿,其中30%以上都采用量化投资方式的现状来说,我国的量化投资规模还不足5%。而当今的国内的A股市场的有效性不强,量化投资可以利用大量的数据统计和挖掘,捕捉市场微观交易机会,享受量化选股策略带来的超出市场的超额收益和市场本身整体上涨所带来的收益。因此选取合适的方法和模型建立量化投资策略开辟市场,为券商和相关机构提升资管规模,获得更高收益具有重要的现实意义。在利用多因子模型进行量化选股的策略中,因子选取和因子分类选择是两个关键点。在这两个方向上,本文都做了相应的优化。在因子选取方面,本文选取的因子的数据包含了财务、估值、动量等等相关因子共计70个,在因子的数量和种类上有了一定的扩充。在因子分类方面,本文使用随机森林算法,对因子进行分类。在运用随机森林算法进行训练之后,它可以针对feature的重要性进行输出,并且可以检测出feature之间的相关影响。由于创造模型的时候是使用无偏估计的方式,因此赋予了模型更好的泛化能力,实现简单,训练速度快。除此之外,本文还把随机森林算法和SVM算法进行比较,从而更加凸显了随机森林算法在容错性和避免过拟合等方面的优势。根据上述设计思路,本文首先收集基本面、政策面、市场面等等方面对股票波动存在可能影响的因子,共70个。选取2008年12月31日之前上市的部分A股股票和沪深300指数成分股构建基于随机森林算法的多因子选股模型,在对其优化和修改之后进行回测,获得了极高的收益率,有了良好的效果。本文通过将新型的因子选择和随机森林算法相结合设计出的量化选股策略获得了高于市场和相关指数以及策略的收益率,具有一定的可行性和实践意义,同时对现有的选股策略和基金公司未来选股策略的设计和发展提供了新的思路。
其他文献
为探索棉田物种多样性对棉蚜的生态调控效应,于2016年系统调查了安徽安庆地区糯玉米与棉花不同面积比例间作模式下棉蚜与玉米蚜种群数量的时序动态。结果表明:在棉花苗蚜发生
目的了解对糖尿病合并高血压脑出血患者术后施行综合性护理的效果。方法将该院2017年2月—2018年1月的64例糖尿病合并高血压脑出血患者,随机分组,对照组给予传统护理,综合组
冠心病的发生以痰浊血瘀证居多,气血津液运行障碍乃为痰瘀形成的基础,脏腑功能失调则是痰瘀生成的根本。痰浊、瘀血同为水谷精微所化,二者相互影响,相互夹滞,受脏腑功能的调
目的探讨铁皮石斛抑制人鼻咽癌CNE2细胞增殖与诱导凋亡的生物学效应及可能的分子机制。方法分别采用MTT、光学显微镜、流式细胞仪与Western blot检测新鲜铁皮石斛提取物抑制C
目的探讨开腹保留盆腔自主神经的直肠癌根治术与腹腔镜经肛拖出直肠癌根治术中保留盆腔自主神经对男性性功能以及排尿情况的影响。方法选取我院2013年10月到2016年10月收治的
目的:通过对麻黄连翘赤小豆汤治疗皮肤病的临床文献总结研究,探讨张仲景经方“麻黄连翘赤小豆汤”在皮肤科的临床应用和前景。研究方法:电子检索中国知网数据库(C N K I,1982
横向联合是区域经济协调发展的重要途径慈廷光区域经济横向联合是社会主义市场经济发展中的一个重要课题。随着区域生产力的发展与科学技术的进步,按社会化大生产的要求,实行横
银屑病,中医称白疙,是一种临床常见的慢性顽固性炎症性皮肤病。典型临床表现为鳞屑性红斑或斑片,伴有不同程度的瘙痒。本病在病程和形态学上具有很大变异性,且由于其缠绵难愈
随着社会转型期的到来和新媒体技术的发展,社会舆情,尤其是网络舆情变得日趋复杂多元,其社会影响也更加多样多变。近年来,宗教领域的社会舆情,尤其是一些突发事件网络舆情较
目的探讨颅脑损伤患者开颅术后再出血原因及防治措施。方法回顾性分析医院2006年1月-2011年12月所行618例颅脑损伤患者开颅术后发生再岀血35例患者的临床资料。结果急性硬膜