基于机器学习的股票排名方法

来源 :天津工业大学 | 被引量 : 2次 | 上传用户:akiro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多年来,在金融市场的股票投资方面,人们一直都希望能掌握其背后运行的规律,并进行分析与预测。各国投资专家也通过使用不同的投资分析方法,利用海量的股票数据进行数据挖掘,以求寻找出股市背后潜在的运行规则和股票交易的规律,实现对未来的股市发展变化进行预测,以达到收益最大化的目的。本文的主要研究内容是上市公司的股票数据以及公司股价的变化情况。根据公司在研究周期内股价变化水平,计算得到特征值,设计了一个优化版本的k-最近邻算法,然后建立上升趋势体系模型,预测上市公司的股价走势类型,选择适合自己风险类型的上市公司进行投资。随着大数据相关技术的不断成熟,在处理大规模股票数据集的平台选择上,本文主要考虑的是内存消耗和数据运算效率方面,采用了大数据Hadoop平台的HDFS分布式文件系统以及更加高效的MapReduce分布式计算框架,使得整个数据集的ETL流程能高效率便捷的运行。机器学习也是本文的一个核心问题,在对KNN算法进行深入研究后,在此基础上提出了面向大数据模式识别算法。此外,本文提出了三类不同特征集,即分钟价格特征、K线特征、股本特征。通过在大量的真实股票数据上的实验表明,各类特征集对预测股票价格走势均是有效的,在同一类特征集上面向大数据模式识别算法得到的预测结果优于k-最近邻算法,而在不同类的特征集上,股本特征集预测结果的准确率比分钟价格特征集和K线特征集有了较大幅度的提高。本文的研究为在大量的股票标的中选择合适的交易对象提供了一种有效的方法。
其他文献
刚进入初冬,家住山东青岛市莱西市姜山镇姜山村五组51岁的苏美军没有闲着,他正在自家承包的500多亩农田旁边监督建设一个衣发项目扶持的大冷库。“几年前想建也建不了,因为那时
古代文学是我国的文学宝库,是我国优秀的文学遗产,先秦的诸子散文、唐诗、宋词等是我国文学天宇中熠熠生辉的明星。但对初中学生来说,文言文历来是一个难点,学生学起来吃力而又乏味。再加上教师在教文言文时,常常采用“字字落实,句句对译”的传统方法,讲解详细而具体,害怕学生掌握不好,又惟恐遗漏了什么。在这种心理驱使下,教师在上面讲得口干舌燥,学生在下面却听得昏昏欲睡,一节课下来,学生听得稀里糊涂,课堂效果很不
目的探讨关节镜对膝关节滑膜炎的诊断和治疗价值。方法对35例膝关节滑膜炎患者进行关节镜检查明确诊断,进行镜下滑膜切除术,观察疗效。结果镜检结合滑膜病理,明确诊断病例为:
2017年是中国电视剧的丰收之年。高传播力和影响力、题材样式多样化、"现象级"作品出现、精品力作数量增加。网络剧制作质量提升,优质"剧"在不同平台上得到认可,渠道多样化稀
外墙防渗漏的质量好坏,直接影响到建筑物的使用效果,给人们的生活、工作带来一系列的烦恼。为了解决这个问题,需要从技术的角度分析渗漏问题的成因,抓住重点,从根本上解决问题。
8月20日,《农民日报》在头版头条位置以《农业综合开发创新的能量裂变》为题刊载长篇通讯,详细报道了河北省平山县葫芦峪现代农业综合开发示范区以机制创新为突破,通过土地经营
马克思主义认为共产主义社会的目标是人的全面发展,在达到这一理想社会之前,无产阶级的目标是争取自身及全人类解放。然而,社会发展目标不仅仅在于发展经济和消除贫困,还应该
目的通过回顾性分析异位妊娠破裂患者的急救,以提高异位妊娠患者的抢救成功率,减少患者病死率。方法对三年来经急诊抢救后收入专科住院的56例异位妊娠破裂患者的急救及护理措
坚持初心、规划引领、集聚民生、软硬一体、敢于取舍,这是我们在智慧城市领域研究与规划咨询工作的总结,也是新型智慧城市建设的推进策略。