论文部分内容阅读
随着程序化高频交易在中国金融市场的迅速发展,针对中国股票市场的市场微观结构的高频分析越发迫切。美国市场70%的交易都是由算法和高频交易完成的,而目前中国市场的算法与高频交易量占比只有10%左右。随着金融市场的逐步对外开放,算法与高频交易量将迅速增加。高频交易特征之一为手续费占比高,常常超过50%,所以用限价单代替市价单是抵消交易成本的方式之一。高频交易的特征之二为频繁挂撤单,对于某些高频交易策略,例如做市策略,需要在限价单与市价单之间进行灵活切换。近年来,大额交易也需要采用TWAP和WWAP等算法交易策略来降低市场冲击成本,核心同样是尽量用限价单替代市价单。所以对限价单成交概率的研究非常重要。这几年国内外研究高频交易主要研究切入点为订单薄(LOB)的动态变化。而订单薄的维度之多、状态空间之大难以用准确的数学模型进行建模与描述。国内外学者构建基于随机过程、统计方法或者深度学习模型研究价格与波动率的形成与演变等,但对动态过程的建模依旧使用了很多静态变量,造成对订单薄动态特征的刻画不够准确。本文通过对深交所股票Level-2快照(tick),逐笔委托和逐笔成交数据进行建模,深入分析订单薄的动态过程,通过多维hawkes模型与订单薄毫秒级高频重构动态计算订单速率,通过成交时间分布,订单速率不平衡和线性模型估计了限价单的成交概率,通过分析模型参数和成交概率发现了中国股票市场微观结构的高频特征。本文首先研究分析了中国股票市场交易机制与订单薄特性。阐述了中国股票市场的参与者从客户端下单到订单进入交易所订单薄队列,以及完成成交的全过程,分析了高频交易的主要技术、程序化交易流程、网络延时对交易的影响、主要的高频策略原理等。用数学定义描述订单薄的形成机制和订单薄的产生是双边连续拍卖的结果,说明订单薄中各种事件之间的相互制约关系,订单流和价格与成交量需要满足一致性原则,进一步说明价格是订单薄动态变化的内生变量。订单薄中买卖限价单与市价单的到达速率、订单价格、时序与订单大小共同决定了市场价格。它们之间的相互作用决定了订单薄每时每刻的形态,这也是本文对订单薄高频重构的理论基础。通过对订单流的研究发现中美股票市场微观结构的不同,中国股票市场订单薄中的订单流长期处于不平衡状态,不平衡比例平均为35%;而美国市场为5%,并解释了其中的原因。由于中国市场对频繁报撤单的限制,其撤单率平均为8%,而美国市场为35%左右。所以订单流的不平衡(OFI)在中国股票市场并不能解释价格短期的变化趋势,本文通过订单的时间维度,引入买/卖队列中限价单在单位时间内执行效率的不平衡(OEI)指标,通过线性模型发现订单薄的OEI是对价格高频变化影响的重要因素,当把OEI加入到Cont等(2013)模型中解释价格的变化,其R~2比之前模型在中国市场提高了47.8%,36.8%,和45.9%。当市场流动性更充裕的时候,OEI解释力比流动性差的时候提高了477.2%,387.6%和333.9%。本文通过时间维度来继续深入研究订单薄的动态特征,计算订单到达队列的速率和订单的成交概率。接着说明了订单的到达对订单薄的冲击作用是持续变化的,作用随着时间在衰减,所以用核函数为负指数形式的多维hawkes模型来描述订单之间的相互作用。论文基于多维hawkes过程,建立了订单到达速率之间互相作用的模型,并用内点法求解其极大似然函数,最后用非线性优化的参数值动态地计算了买一减少、买一增加、卖一减少、卖一增加这4种类型订单每种订单到达订单薄队列的瞬时速率,每种订单速率都会受到其它类型订单到达队列的影响。分析了多维hawkes模型计算的时间复杂度,表明用高频数据(精确到毫秒)来建模与求解的时间复杂度非常高,从数学上说是一个算力密集问题。本文的研究改变了之前研究将订单速率作为一段时间内的“匀速直线运动”的静态方法。通过分析多维hawkes模型的参数,发现在同样的高频时间段内,参数中跳跃幅度相对大小和最优买/卖价格的迅速变化一致;参数中衰减速率相对大小和最优买/卖队列的长度变化一致。是中国股票市场微观结构高频领域的一个重要发现。同时为了提供另一种订单速率快速求解方案并计算限价单成交概率。论文第五章通过逐笔委托和逐笔成交数据,建立了实时订单薄高频重构算法来动态描述每时每刻订单薄的形态,使订单薄的刷新频率从3秒一次升级到10毫秒一次,或者每当订单薄事件发生,就更新一次订单薄。从而把hawkes模型计算订单速率变成可以对每时每刻订单薄队列进行直接加减运算而得到。对订单薄的高频重构带来了三大作用:(1)能100%准确地判断当订单薄事件发生时,该事件发生在订单薄中的哪个队列,哪个价格档位,从而判断是否属于最优买卖队列;(2)动态计算每次订单速率的变化,而不是一个时间段内的平均值;(3)提供了除了时间复杂度较高的多维hawkes模型以外,普通服务器就可以实时计算的方法,从而保证交易信号的及时性。第六章先分析了限价单成交时长的分布,发现随着交易时间增加,限价单数量逐步变得稀疏与陡峭,且买/卖两方分布基本对称。基于历史数据计算了在中间价不变的情况下订单的实际成交概率,发现所有实验标的股票的实际成交概率都是随着成交时间的长短,先快速增加后缓慢减少,且这种趋势和队列消耗速度与订单深度的比值走势完全一致,上述规律成为基于线性模型实时计算限价单成交概率的重要依据。基于多维hawkes模型与订单薄高频重构所得的订单速率进行了限价单成交概率的估计:首先使用first passage time和扩散极限方法计算在订单速率平衡的情况下,限价单的成交概率,发现和实际概率分布相差很远,分析了该方法的不足。但发现波动率和限价单的成交时间负相关。其次在订单速率大多数时刻不平衡的情况下,通过订单速率与线性方程估计限价单交易所需时间,用所需时间找到过往在这个时间内且在订单薄中间价不变的条件下的历史限价单实际成交概率,这个概率便是这笔限价单模型所估计的实时成交概率。从而完成从限价单成交时间到成交概率的转换。从而可以根据最新限价单的真实成交时间分布变化,更准确地用模型估计限价单成交概率。在样本内,发现有些股票在连续月份的概率估计的准确率都很高,估计准确率最高可以达到80%,且在相同时间段内,实际概率和模型计算概率走势一致。在样本外,准确率比样本内有所下降,但依旧较高。实际概率和模型计算概率走势有时候一致,有时候有所改变。对比发现基于多维hawkes模型比基于订单薄高频重构方法所计算的限价单成交概率平均准确率更高。最后发现基于股票全天交易时段的多维hawks参数的平均值发现中国股票市场在高频下微观结构具有三大特征:(1)订单薄队列的消耗速率几乎都大于队列的增长速率。(2)价格的变动主要是由市价单(主动单)的冲击造成的,市价单的冲击来的迅速,消散的也快;而限价单来的慢,但作用持续的时间也长,队列的增加是一个相对持续缓慢的过程。(3)不同订单类型之间存在明显的促进作用,其作用甚至大于订单本身的自激励效应。依据本文的研究,得到了中国股票市场微观结构高频特征9个。最后针对日内模式发现对于多维hawkes模型参数中每种订单总的跳跃幅度,计算买卖方向总的跳跃幅度差,其方向和日内收盘价与开盘价差的方向一致。本论文的研究可为高频交易,尤其是做市商策略及VWAP与TWAP算法提供方法上的支持。对完善中国股票市场微观结构,尤其是在高频下的观察与研究具有重要意义。