基于模型树的沪深300指数预测研究

来源 :河北经贸大学 | 被引量 : 0次 | 上传用户:zhangyiyuxia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习技术的迅猛发展,基于机器学习的预测方法越来越多地应用到股指预测中,然而目前股指预测的一些算法不能够很好地适应证券数据的波动特征,预测准确率仍有提升的空间。因此找到证券数据的波动特征,进而构建一个能够提高预测准确率的预测模型,探究证券数据的内在规律,使得股票市场能够更好地发挥作用,并且在满足市场监管和投资者需求等方面有重要的现实意义和理论价值。本文的主要研究内容如下:
  (1)本文将模型树算法应用于证券数据分析,并提出了一种新的分裂算法——最大离差法,解决了模型树中常用的最小损失函数分裂算法在寻找分裂点时存在的问题。使用基于最大离差算法的模型树(Model Tree Based on Deviation Maximization,MTDM)获得股指数据的最佳分裂点,经过多次分裂,将股指数据分裂为多个数据段,使其能够符合证券数据的走势特征。使用沪深300指数日收盘价数据进行实验,验证了本文提出的算法相较于基于最小损失函数的模型树算法(Model Tree Based on Least Loss Function, MTLLF)获得的分裂点更加合理,最后使用基于最近分裂段的线性回归算法对其进行预测,通过多项预测衡量指标验证了该模型的预测效果较好。
  (2)针对原模型树算法只使用最近分裂段进行线性预测,将其余各分裂段的信息丢弃的问题,结合证券领域的波浪理论,本文提出了基于波浪理论的模型树(Model Tree Based on Wave Theory,MTWT)构建和调整算法。根据最大离差分裂算法获得的分裂点,构建和计算出分裂段的时间、空间等属性信息,并通过本文提出的构建算法,构建出初始的基于波浪理论的模型树,随后使用调整算法调整各分裂段的级别和父子关系,使其能够保留各分裂段之间的关联信息。使用沪深300指数日收盘价数据进行实验,验证了构建和调整算法的正确性。
  (3)在前述股指分裂、模型树构建和调整的数据基础上,本文提出了基于波浪模型树的股指预测模型,使用多段股指数据信息进行预测。使用沪深300指数的日收盘价数据进行实验,使用多项预测评价指标衡量模型的预测误差,并通过多组对比实验验证模型预测效果。实验结果表明本文提出的股指预测模型相较于长短记忆神经网络(Long Short-Term Memory,LSTM)、门控循环单元(Gated Recurrent Unit,GRU)以及多层感知机(Multilayer Perceptron,MLP)预测模型有更好的预测效果,验证了本文预测模型的有效性。
其他文献
蛋白质在生命活动中起着重要作用,了解蛋白质的结构与功能,有助于人类探索生命的运行机制,促进治疗药物的研发。其中,蛋白质与核酸的结合对细胞转录过程具有重要的调控作用,而蛋白质的翻译后修饰广泛存在于细胞翻译过程中。因此,核酸结合蛋白和蛋白质翻译后修饰位点的预测对于了解蛋白质的功能具有重要意义。传统的生物实验方法周期长、成本高,无法满足日益增长的大规模蛋白质数据的预测。基于计算的方法消耗成本更少且简单高
显著性检测是通过模拟人的视觉注意机制,在图像中提取具有显著性的目标区域的过程。作为诸多计算机视觉应用的预处理步骤,显著性检测已广泛应用于多种任务中。本文总结和分析彩色图像显著性检测和高光谱图像显著性检测技术的研究现状,并基于深度学习研究实现了结合对抗学习的彩色图像显著性检测算法和结合自监督学习的高光谱图像显著性检测算法。1.结合双流特征融合及对抗学习的彩色图像显著性检测(SaTSAL)在CGAN主
学位
异质信息网络蕴含丰富的结构信息和语义信息,能够形象、灵活地区分交互系统中对象及关系的差异性。链路预测是图挖掘的基本问题,它根据观察网络中现有的信息估计两个节点之间链路的存在概率,可作为解决数据挖掘中许多任务的基础。现有研究方法多数只关注网络拓扑结构而忽略了节点属性信息,并且用于链路预测的相似性度量方法往往根据元路径考虑节点间的路径相似性。本文根据数据特性提取节点属性信息,结合图核理论,进行异质信息
当代计算机技术与网络迅猛发展,已经深入到各行各业。随着信息时代的到来,人们在享受网络所带来的方便、快捷的同时,也正在被各式各样的网络安全问题威胁和困扰。近几年,网络攻击日渐复杂且具有隐蔽性,致使传统的基于被动防御的网络安全产品和技术难以应对现阶段的网络安全问题,而基于主动防御的网络安全态势感知技术能够更好的解决此类问题。自20世纪末网络安全态势感知技术被提出以来,其被广泛应用于网络安全的各个领域中
学位
脑机接口系统拥有可以绕开外围神经和肌肉组织,在大脑和外部设备间直接建立连接通路的优势,为探索大脑提供了技术支持。基于运动想象任务的脑机接口系统是一种被试者不需要借助外界刺激,仅通过自身想象运动就可以产生脑电信号的自发式脑机接口系统。但是运动想象脑电信号是一种极其弱小的时序信号,具有连续非平稳和低信噪比的特性,且选择信号通道时,部分传统方法采用人工选择的方式,其余方法虽然将全部通道信号输入网络,但信
学位
文本相似性度量作为一项基本任务,对基于文本的分类、聚类及排序等有着广泛影响。现有的文本相似性度量方法往往忽略了非结构化文本数据中的结构化信息及背景信息,仅考虑文本中的单词粒度或短语粒度不能很好地满足文本相似性度量任务的需要。针对上述问题,本文提出基于异质信息网络的文本相似性度量方法(HINSim),将文本相似性度量转化为加权异质信息网络中的节点相似性度量。扩大文本的特征粒度,利用文本的显式语义信息
图像分类是机器学习领域重要的研究课题,广泛地应用于多个领域。同时,日常生活的普遍数字化使得图像数据量急剧增多,使得图像分类的研究变得越来越具有研究价值和现实意义。深度学习的出现极大提升了图像分类的准确率,但其模型训练依赖大量标签数据,且在训练集和测试/应用数据集具有相同统计特征前提下才能达到预期效果。现实应用中带标签数据的获取有时比较困难,或代价很大,迁移学习可以利用少量标注数据或已有过期标注数据
学位
目前超市商品结算主要通过条形码或RFID标签技术实现,条形码需要人工扫描,结算效率低,RFID标签成本高且不可重复利用。因此,如何利用人工智能技术实现超市商品的快速检测与识别以实现自动结算,成为近几年的研究热点。本文基于此展开研究,提出了一种基于深度学习的超市商品检测与识别算法,以降低商品结算成本,提高效率。针对超市商品种类繁多且商品特征存在局部性等特点,本文从应用场景出发,利用左、上、右不同方位
学位
随着医疗影像技术的发展,利用医疗影像进行疾病诊断已经成为各大医院的主要诊断方法。医疗影像诊断需要经验丰富的医生,而这样的医生数量较少,而且仅仅通过人工对大量医疗影像诊断会出现疲劳诊断甚至误诊的情况。随着深度学习技术的发展与应用,利用人工智能进行医疗影像识别受到了学术界的关注。由于医疗影像数据的成像形式特殊,数据集数量少且不易提取影像特征,当前的深度学习算法对医疗影像的识别准确率较低且时间复杂度较高
学位
核心专利一般是指某个技术领域的某种产品的关键核心技术所对应的专利[1],对某行业的核心专利进行识别是挖掘该行业关键核心技术信息的有效途径,进而可以为行业企业提供技术研发指导。为了更全面的对核心专利进行识别,本文提出了一种基于文本数据挖掘的核心专利识别方法,该方法首先通过文本挖掘相关智能算法对专利进行领域细分,然后在细分领域的基础上使用改进型PageRank算法对专利进行评分以识别该领域下的核心专利
学位