【摘 要】
:
现代社会,股票已成为大众所热衷的投资手段之一。若可以预测股价的走势,就可以在适当的时机对交易市场进行一定的调控引导,对投资者的投资方向也有指导意义,对相关经济领域的健康发展也有参考价值。针对股票数据高维度、噪声大、低稳定特点,如何利用机器学习来分析预测股票趋势成为了新时期的热门课题。目前,基于机器学习的量化分析和股价涨跌预测技术大多是将股价的升高和降低看作是一个二分类问题开展研究。但是,在以往的股
论文部分内容阅读
现代社会,股票已成为大众所热衷的投资手段之一。若可以预测股价的走势,就可以在适当的时机对交易市场进行一定的调控引导,对投资者的投资方向也有指导意义,对相关经济领域的健康发展也有参考价值。针对股票数据高维度、噪声大、低稳定特点,如何利用机器学习来分析预测股票趋势成为了新时期的热门课题。目前,基于机器学习的量化分析和股价涨跌预测技术大多是将股价的升高和降低看作是一个二分类问题开展研究。但是,在以往的股票量化分析研究中,对这个分类问题中可能出现的数据集不均衡问题没有引起充分关注,比如:一段时间内,股票市场会出现“牛市”或“熊市”的特殊情况,在“牛市”中,所有股票上涨的几率远大于下跌的几率,在“熊市”中则相反,大部分股票都容易处于下跌的状态。由于分类明显不均衡,这使得市面上常用的分类算法在特殊情况下很难做出精准预测,无法帮助投资者在“牛市”或“熊市”中更好的规避风险或者获取收益。为了解决分类不均衡时的股票价格涨跌趋势预测问题,本文将代价敏感学习的思想引入预测模型研究,做了以下四个方面的工作:1.数据收集及特征选择。在白酒、券商、医药、教育、科技板块中选取比较具有代表性的5支股票,收集2017年全年249个交易日最高价格,最低价格,收盘价格,成交量等数据,以分钟为基本粒度对近30万条数据进行清洗并划分数据集,开展特征工程,建立收盘价的简单移动平均值(SMA)、收盘价的指数加权移动平均值(EWMA)、股票动量指标(MTM)、相对强弱指标(RSI)等8个重要特征。2.提出一种代价敏感函数。基于代价敏感学习的处理方法,根据样本实际分布构造代价因子,将权重距离引入代价函数的计算过程,构建一种综合考虑各个特征重要性的代价敏感函数,称为:多因素加权代价敏感函数,它能更好地捕捉在此问题中不同类别的误分代价,防止少数类被忽略。3.设计两个分类算法。通过将多因素加权代价敏感函数分别与支持向量机和随机森林相结合,分别设计了两个代价敏感分类算法,即代价敏感支持向量机(Cost Sensitive-Support Vector Machine)和代价敏感随机森林(Cost Sensitive-Random Forest),并在训练集上优化模型;同时,设计加入防恶意操作策略,从而防止“庄家”和投资者在使用相同的模型预测时进行恶意操盘的情况发生。4.指标评价和测试验证。为了更好的评价模型在不均衡分类问题中的表现,采用AUC作为评价指标,在所构建的股票数据集上,将这两种分类器和市面常用的股票趋势预测模型进行了对比实验,实验结果表明,本文研究设计的两种二分类算法训练的模型效果更好,可以为投资者在“牛市”或“熊市”市场环境下的股价涨跌预测问题提供参考。
其他文献
社交媒体以其广泛的参与性、多源的传播性与极强的时效性已成为灾情信息获取的重要途径,在近年来的灾害应急救援中发挥着重要的作用。我国是一个灾害频发的国家,有效的管理和利用社交媒体数据辅助减灾救援有着现实意义。当前,灾害背景下利用社交媒体挖掘涉灾信息并辅助减灾的方法备受关注,并取得了大量应用成果。但当前的研究方法多从单一的文本挖掘或空间分析出发,很少对二者进行一体化分析和使用,尤其是集成化应用系统更为匮
当擦边分岔和光滑分岔同时出现时,非光滑系统会发生余维二擦边分岔。本文研究了两类二自由度碰撞振动系统的余维二擦边分岔。第一类,具有单侧约束的二自由度碰撞振动系统。首先,讨论了擦边周期运动的存在性条件。利用不连续映射方法构造了1/n碰撞周期运动的全局Poincaré映射,并得出1/n碰撞周期运动的分岔条件。然后,结合擦边周期运动条件和碰撞周期运动分岔条件推导出擦边分岔和光滑分岔同时发生时满足的解析表达
本研究从宏观层面阐述区域高等教育与区域经济社会发展的相互关系,从微观层面对福清区域高等教育发展的适应性进行重点分析,并在此基础上提出增强福清区域高校与区域经济社会
随着我国市场经济的发展,我国于上世纪80年代开始实行招投标制度。随着建筑市场的良好发展,以及完全开放的建筑业市场,给建筑业总产值快速增加为建筑企业投标提供了良好的市场机遇。随着建筑业市场的不断成熟和扩大,给建筑业市场的投标市场带来了很大的冲击,给建筑企业也带来了巨大的挑战。一套更科学合理的投标报价决策的体系能够提高建筑企业的竞争能力。论文从投标方角度出发,以建筑工程项目投标报价为研究对象,研究基于
小学时期,估算是学生在数学学习中很重要的一环,它可用于理想结论的近似估计,使计算更加轻松。教师要通过分析要使学生清楚的明白估算是有理论依据和现实存在的。估算还可以
在小学数学中培养小学生的估算意识,能够培养和提高学生的推理以及逻辑思维判断能力,以学生为教学主体,通过创设新颖的教学情境,激发学生的估算兴趣,让学生主动探究算法、算
智能实验室的排课管理是以实验室排课为目标,在学校教务处实现统一安排的教学任务,其内容是根据授课计划制定出一个合理的可行的课表,是落实整个实验室教学和实验室管理的核心功能。在课程安排中涉及的核心因素包括时间、学生、教师、课程以及教室等,这是一个非线性的多目标组合优化问题,此类问题一般不存在,唯一的最优解,所以处理课程安排的关键思路在于确定近似最优解,从而能够显著的减少计算难度。针对实验室的详细的排课
本文以长阳这一文化资源丰富地区为例,探讨基于文化生态保护理论下的旅游可持续发展评价体系,实现文化资源的合理保护,以持续支撑旅游的可持续发展。文章首先分析了文化生态
在当前的社会发展形势下,企业将创新发展作为根本性的发展战略,对于知识与技术密集型企业来说,其创新的基础是知识的创新。而以人为基本载体的“知识传承模式”已经很难适应企业的不断发展与创新要求。在信息与知识爆炸的时代,众多企业认识到知识的战略意义,并开展了不同程度的知识管理工作,但是应用效果不太理想。目前众多企业缺少的不是知识,而是缺少有效应用知识实现创新的能力。本文对沈飞设计研究所开展知识工程的案例进
网络的正常、持久和稳定运行取决于通信机房管理系统的可靠运行。近年来,通信机房设备安全监控系统、环境监控系统和视频监控系统已被广泛使用。应用计算机技术、通信技术和大数据技术,形成一个集成的、联网的、统一的监控系统,将有助于提高运行的可靠性和正常的维护效率,并降低维护成本和工作强度。机房里的所有设备之间存在紧密的联系性,为了实现对机房环境的实时掌控,同时还为了可以及时定位和预防各种警报,如火灾、漏水和