论文部分内容阅读
由于量化投资的兴起,对股票价格时间序列的分析显得日趋重要。金融量化中,通过对相似股票价格时间序列的搜索和金融模型匹配可以有效预测未来股票的发展趋势。为了解决现有搜索和模型匹配算法时间复杂度过高,准确率较低的问题,本文通过一种基于动态规整距离的相似股票识别方法、一种基于关键点提取的混合金融模型匹配算法等研究,提高相似序列搜索和金融模型匹配的效率和准确性,并设计实现了一套面向量化交易的数据分析平台。论文的主要研究内容如下。(1)提出了一种基于动态规整距离的相似股票识别算法。首先,我们的方法基于极值点等降维方法提取序列的趋势特征。其次,我们使用该特征作为条件来搜索具有相同特征的序列以形成候选集。然后,针对候选集中的每个序列,我们过滤出重要点并将其添加到特征点列表中以更好地保持原始序列的形状特征。最后,基于动态时间规整距离得出相似的时间序列。在真实股票数据集上的实验结果表明,该方法可以提高相似股票搜索效率和准确率。(2)提出一种基于关键点提取的混合金融模型匹配算法。首先,我们对股票序列进行降维,并在降维结果的基础上,根据金融模型对价值、时间的要求提取股票价格时间序列中的金融模型关键特征点,以减少股票价格序列中噪声和趋势小幅度波动的影响。然后,我们构建混合金融模型,并基于该模型和金融模型关键特征点对时间序列进行过滤,以便我们可以快速准确地从股价时间序列中定位到满足此金融模型的子序列。在真实价格数据集上的实验表明,与传统方法相比,该方法能够提高匹配的准确性,降低匹配过程花费的时间。(3)设计并实现一套面向量化交易的数据分析平台。系统划分为用户交互模块、计算引擎模块、数据抽取模块和数据清洗模块四个模块,分别负责接受用户请求并执行相关业务逻辑、实现相似股票搜索和金融模型匹配功能、维护数据库数据并提供读写接口和进行数据检查提高其数据可用性。