论文部分内容阅读
随着近年智能算法以及数据挖掘技术的不断进步,人们对于大数据的处理越来越科学化;与此同时,基于大数据处理的量化投资也开始在证券投资领域大放光彩。规避量化投资的热门区域,本文以市场低频数据为研究对象,针对中散户市场参与者(中散户的划分依据是Wind中“资金流向”指标的统计口径,详情见附录1)构建了基于资金流向的择时策略。策略的核心被分为选股和择时两部分;选股部分,不同于传统的量化选股策略中以获取高收益为最终选股目的,本文模型的选股以寻找波动性大,蕴含信息丰富的股票为目的;其次,本文模型的择时部分以资金流向指标为基础,选取大户为指标数据的提取口径,以获取拥有潜在的优质收益为目标,选取最优快慢线组合(模型关键参数),同时,采用经典的金叉、死叉,理论判断买卖时点。选股过程:本文以沪深300指数成分股为原始研究对象,通过Wind咨询平台的数据量化接口获得原始数据,经过对原始数据的预处理获得有效股票282支;然后针对筛选出来的有效股票,以复杂网络构造窗口期(2016/01/01——2016/12/31)相应的对数收益率时间序列数据计算出相关性矩阵Cρ,并通过距离转换公式将其转化为距离矩阵Cd;再然后,以有效股票为复杂网络的节点,以股票之间的距离值为边长构造复杂网络,通过设定不同的链接阈值,获得了结构特性不同的复杂网络;分析对不同链接阈值限定下的复杂网络统计特性,发现所构造网络具有良好的鲁棒性;最后,选取链接阈值在区间0.276——0.336之间(0.001为步长)时所对应的复杂网络为研究对象,共计60个复杂网络;分别选取每个复杂网络中,度中心性、介数中心性、紧密度中心性排名前五的节点所对应的股票加入待择时股票池;60个复杂网络中剔除重复的股票共计获得,度中心性优异股票12支、介数中心性优异股票12支、紧密度中心性优异股票12支,且最终合计获得待择时股票34支。择时交易过程:本文在1——29日之间选取快慢线的滚动窗口期跨度,共计获得406个快慢线组合;然后,通过模型训练窗口期(2017/01/01——2017/07/31)不同快慢线组合限定下,交易结果的理论赔率、日可交易概率、相对收益率、损失率指标的对比分析,共计获得优异的快慢线组合两个:(9,13)和(10,12)。最后,经过对本文所构建的量化择时模型进行训练窗口期(2017/01/01——2017/07/31)与模型回测窗口期(2017/08/01——2018/03/01)的有交易费用和无交易费用的模拟实盘交易,结果均获得了,年化收益率、夏普比率、波动比率以及最大回撤比率方面优异于相同窗口期一开始便买入并持有沪深综指(不考虑交易费用)所获得的基准投资收益,尤其是在市场行情下行时,模型策略的表现更为突出,拥有更好的规避市场下行风险的能力;同时,几乎在每个时间段,模型在没有交易费用约束下的表现总是好过有交易费用约束的情况,且随着时间的推移,交易费用对模型的累计影响被不断放大,特别是在策略收益率的信息比率和alpha值这两个指标上表现尤为显著。为此,也证明了我国股票市场的低频数据在时间窗口期(2016/01/01——2018/03/01)用以构建量化策略是有效性,同时也证明了我国股票市场在现阶段是无效的。