基于短时相关性的股票推荐算法研究

来源 :锦绣·下旬刊 | 被引量 : 0次 | 上传用户:taozhzzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:股票市场作为多人参与的复杂系统,具有很大的随机性。随着信息技术的普及,如何通过计算的方法来选股是很多股民都感兴趣的。本文针对中国股市的股票具有短时政策性、新闻性、概念性、关联性等特点提出用短时相关性来推荐股票的方法。通过实际的沪深股市数据,发现这种推荐方法确实能带来较大的利润,且不需要人们去耗费巨大精力选股。当然,此方法仍有一些不足,需要改进。
  关键词:股票;推荐;相关性
  1 引言
  股票是金融市场中的一个重要组成部分,受到广大投资者的热切关注。在股票市场的长期跟踪研究中发现,股票之间也会有明显的相互影响作用,尤其是在地区板块、行业板块内,这种相互影响关联作用更加明显[1]。甚至有时候,在不同板块、不同概念及不同行业股票之间也会出现同涨同跌等现象,学者将其称为联动[2]。总而言之,某一支股票的价格也会随着其它股票价格的波动而波动,某一支股票价格的波动也会使别的相关股票的价格随之波动[3]。这种相互作用也可以称作股票之间的相關性,是许多投资者研究的热点之一。本文分析了用原始股票涨跌幅来分析相关性的缺陷,提出了用量化方式来强调涨跌的同步性,弱化涨跌幅度的差异,同时将概念行业相关性加权,得到了适应于股票的相关性计算方式,并以此设计出了一个股票推荐算法,在沪深股市2020年1月到4月的数据上进行了回测,取得了较为满意的效果。
  2 方法
  相关系数最早是由统计学家卡尔·皮尔逊提出的用来研究变量之间线性相关程度的量,两个向量x,y的皮尔逊相关系数p(x,y)定义如公式(1)所示。其中ux,uy分别为xi,yi的均值。
  皮尔逊相关系数相关系数范围是[-1,1],相关系数不同的值体现了不同的意义。当相关系数越等于1时候,表示两个向量完全正相关,当相关系数等于-1时,表示两向量完全负相关。当系数接近0时,表示两向量不相关。首先本文取股票20日的涨跌幅作为股票的指标x,(x[i]为每一日涨跌幅),计算他们的相关系数,但是发现在这种情况下大涨或大跌的股票相关系数非常高,即直接使用原始涨跌幅的话,相关系数更看着涨跌幅度。为此,本文将涨跌幅量化如公式(2)所示
  在这种量化指标下,涨跌幅度对相关系数影响就没有那么高。两只股票具有高相关性更在于他们涨跌的同步性。同时我们定义一支全为零向量的股票与其他股票相关性为0,即20日不涨不跌的股票不再关注。接下来,本文定义股票所属板块和概念的向量Cx,若股票属于某一概念i,则对应Cx[i]=1,否则Cx[i]=0。
  综合股票行业概念和走势,我们定义了如下相关系数计算公式。
  根据公式(3),我们可以算出任意两只股票20天的相关性。这种相关性一般能维持一段时间。
  在每日开盘后,每只股票根据自身涨跌幅度对与其相关性排在前十的股票进行推荐(涨)或者反对(跌),推荐力度与自身涨跌幅成正比,然后将推荐票数比较多的股票反馈给投资者。如果一支股票得到了较多的推荐,那么可以知道必然有一批围绕此股票的相关性较高的股票都是涨的,这一批股票很可能就反映了当天的热点。同时,当一批高度相关的股票有启动的苗头的时候,因为推荐,这种苗头会被放大,从而可以在热点还没有启动的时候就能提醒投资者。而在热点概念之外的且自身板块内很多股票是跌的股票,会因为得到较多的反对票,从而提醒投资者放弃。
  3 实验与结论
  本文以2020年1月到4月的沪市深市的股票为实际数据,进行了回测,发现股票涨跌确实是有联动效应的,即部分大涨的概念股确实具有很高的相关性。如图所示万象德农和顺鑫农业两只股票,他们每日涨跌的幅值相差比较大,但是涨跌的同步性较好,所以用本文提出的相关性计算方法可以得到他们是高度相关的。因此,本文提出的方法也可以用来研究团体股票的走势,从而可以分析出一群高度相关的股票具备了什么样的走势后,更有可能大涨,提高人们买股的成功率。
  参考文献
  [1]汪玉环.股票间相关性测量方法的研究及应用[D].哈尔滨工业大学,2017.
  [2]牛红丽,王军.基于选举模型理论研究股市特性[J].北京交通大学学报,2012,36(3):138-144.
  [3]陈花.基于复杂网络的股票之间有向相关性研究[D].北京邮电大学,2012.
  [基金项目]玉林师范学院博士科研项目G2018014
其他文献
摘 要:时代飞速发展,当今社会已进入大数据时代,大数据是一种规模在获取、存储、管理、分析等方面远远超过了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征,数字图书馆在此背景下应运而生,有效数据的高效抓取利用,是摆在数字图书馆建设前面的难题,下面文章重点对大数据背景下如何发展数字图书馆进行了分析,针对数字图书馆建设发展过程中出现的问题提出解
期刊
摘 要:信息时代背景下,档案工作作为重要的信息资源,其价值和作用日益显现。这种形势为档案管理工作带来了机遇和挑战,档案工作只有主动作为,勇于创新才能要适应发展要求。目前档案信息化管理还存在一些问题,阻碍了档案工作的深入开展,对此,要对档案信息化管理进一步完善和加强。  关键词:档案;信息化;发展  随着计算机技术的普及,社会已经步入了信息化的时代,这对社会各项事业发展产生了深远的影响,也对政治生活
期刊
摘 要:随着时代的发展信息技术逐渐的普及到各大医院中,医务工作者变成体现医院管理水平的一项重要指标。在新形势背景下,医院档案相关管理的信息化建设存在的问题通常表现在医院对于档案管理意识较弱、自身档案管理的水平较低以及没有规范的信息化管理制度等,本文结合这些问题提出相应的解决措施,希望可以给大家带来帮助。  关键词:信息化;医院;档案管理  医院档案的管理工作作为医院管理工作过程中的一项主要的内容。
期刊
摘 要:版画创作根据创作的材质不同,有很多不同类型,其中包括木版版画、石版版画、铜版版画、丝网版画、纸版画、其他版画等等。版画是一种具有象形结构图样的绘画作品,它在视觉形式和空间的表现形式上具有开放性和创造性,而且有着自然美和韵律美,是人们对于优秀图画造型的独特艺术创作。本文主要分析了版画创作艺术形式,深入探究版画艺术创作对于我国优秀文化传承的重要意义。  关键词:版画创作;艺术形式;文化传承;木
期刊
摘 要:BIM技术在今天的建筑行业,日益成熟,越来越多的工程项目使用到了BIM技术。科学进行工程项目的施工管理是一个项目取得成功的关键,就以a小学工程为例的实际项目中,传统二维图纸很难清晰直观地表达出门窗的低高度、顶高度、实际三维效果图和基本墙体的砌筑工程量、墙体的样板图。为了更好地解决门窗工程和墙体砌筑工程的一系列问题,从实际数据出发,整体分析该项目墙体工程量以及门、窗的明细表,并且构建直观的建
期刊
摘 要:主要介绍脱硫及脱硝技术,简述其工艺原理及特点,分析对比脱硫及脱硝技术特性。针对循环流化床锅炉机组工程建设实况及锅炉燃烧特点,污染物排放控制现状,以及存在关键问题的基础上,对电厂脱硫、脱硝技术的应用现状、各种技术的优缺点,机组的适用性进行分析,选择的最佳大气污染物超低排放改造技术。  关键词:脱硫;脱硝;方法;特点  1 引言  NOx的排放对人体有致毒作用、对植物有损害作用、形成酸雨、光化
期刊
摘 要:现在很多新闻报道的第一现场充满了不可预测的危险,比如一些大型的自然灾害,或者是会影响记者人身安全的公共突发事件。为了提升对这些事件的报道能力,保障新闻记者的人身安全,为党和国家了解第一现场提供第一手的资料,应该加强无人摄像机在电视台的应用。本文就对此进行了详细分析。  关键词:无人摄像机;电视台;应用  随着科学技术的发展,人们的生活水平和质量从各个方面都得到了明显的提升和改善,电视台也不
期刊
摘 要:肿瘤标志物在肿瘤患者的诊断、治疗和预后方面都有非常重要的作用。肺癌是发病率排名第一的恶性肿瘤,肺癌的种类可以分为小细胞肺癌和非小细胞肺癌。不同类型的肺癌的治疗方式截然不同。通过检测患者的肿瘤标志物可以有效的鉴别肺癌类型,并可以在治疗过程中实现动态监测,据此做出疗效预测和方案调整。  关键词:肺癌;肿瘤标志物;诊断  一、肿瘤标志物的概念  肿瘤标志物(Tumor Marker,TM)是存在
期刊
摘 要:企业计算机办公自动化是贯穿在整个企业当中的一个系统,实施、设置在企业中的每个部门当中。现如今这个社会,网络已经成为社会上必不可缺的存在,世界上几乎各行各业都在利用网络来推进工作的进行,为了加大企业的工作效率,形成了一种网络系统——计算机办公自动化。计算机办公自动化只是行政管理系统的一小部分,但也是非常重要的一个部分,企业一直都非常重视这项工作,是由于它为企业带来了巨大的便利与效益。本文章主
期刊
职业教育教学质量保障,关系到教学质量的生命线,贵州交通职业技术学院的教学质量保障体系历经二十几年,从第一代的“双加”教学质量保障体系,包含20张内涵运作表、71个观测点。关注着我校教学秩序的有序进行和对教学质量的监控、预警。2016年我院成为全国“诊改”试点院校,牵头贵州省职业教育诊改工作,诊改实施方案通过全国诊改委审核。迎来了“内部质量保证体系2.0”时代。主要按照专业定级、课程定星、教师分梯、
期刊