金融高频数据的关联规则增量算法改进研究

被引量 : 0次 | 上传用户:yang20090907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在金融市场中,高频数据包含了以分钟或秒为采集频率的数据,以及在交易过程中实时采集的数据。对金融高频数据进行挖掘研究,能够更多且更准确地捕捉到证券市场发生的每一个细小的变化,因而利用高频数据研究股票价格比低频数据更具优势。从股票高频交易数据中找出不同股票之间的关联规则,有利于证券投资者了解股票的走势以及股票之间的关联关系,对于做出正确的投资决策起到积极作用。本文主要通过改进后的关联规则增量更新算法研究金融高频数据问题。首先介绍了股票的相关知识,金融高频数据的相关特点和发展现状。其次,介绍了关联规则的定义和相关属性,并对典型的Apriori算法进行了分析;利用Apriori算法通过大量实际的高频股票交易数据进行了实时的增量挖掘,从而得出了一些不同股票价格之间的关联规则。然后,针对原始的股票高频数据量很大,新增加的高频数据量很小,而经典的Apriori算法需要频繁扫描整个数据库的特点,本文对典型的Apriori算法进行了改进;通过在Apriori算法的候选频繁项集基础上新增加了次选频繁项集和备选频繁项集,将改进的增量更新算法同样应用于先前的高频数据进行挖掘,因为大大减少了扫描原始数据库的次数,所以运算速度大幅提高;同时,由于新增了次选频繁项集和备选频繁项集,使得产生频繁项集的候选项集规模扩大,发现频繁项集的精确度也有所提高。本文采用的是上证和深证的8只医药股的五分钟数据,并利用典型的Apriori算法和更新后的增量算法分别进行挖掘,实验结果表明,更新的增量算法在运算时间和提取关联规则的准确度方面明显优于典型的Apriori算法的增量挖掘,对于投资者做出正确的投资决策具有一定指导意义。
其他文献
<正>当前昆明市政府大兴固定资产投资,由于摊子太大,周期太长,而政府的财政收入可用资金又有限,目前昆明市政府主要财政收入主要三个来源,即:一是土地出让,二是税收收入,三是
实行财务业务一体化的财务管理更优于传统意义上的会计电算化,它按职责分配角色,分工协作,业务信息实时传递到财务系统,自动生成凭证,无需人工做账,实现了财务信息实时全面反
随着互联网技术的普及,计算机网络对于人们的影响不断加深,互联网应用的更新速度可谓日新月异。与此形成鲜明对比的是,今天的互联网基础设施与其诞生初期相比并没有太大本质
传统的金融学理论中有两个假设:市场有效性假说和“完全理性人”假设。但20世纪80年代以来,出现了大量与传统金融理论不一致的股票市场异常现象,这些异常现象已经难以用传统的
离心式机油滤清器广泛用于拖拉机、汽车等发动机上。使用离心式机油滤清器可提高过滤效率更好地保护发动机。它的技术状态的好坏对发动机的正常运转、曲柄连杆机构和配气机构
近年来,我国商业银行不良资产问题日益突出,已成为影响我国银行业乃至整个金融业稳定的重要问题。本文以美日两国银行业不良资产处置方式为研究对象,通过比较分析美日两国商
本文使用中国综合社会调查(CGSS2008)数据,定量检验了经济全球化对中国居民幸福感的影响及其传导机制。结果表明,经济全球化显著提升了中国居民幸福感,但其主要通过降低通货
品牌是企业的核心。强势品牌能有效地将同质产品与竞争对手区分,同时带来更多忠诚客户及良好的销售业绩。然而,受产品生命周期、市场变化及企业结构调整等内外部因素的影响,
本文首先通过阐述了邮票视觉设计的相关概念,研究分析了邮票视觉设计的发展也演变,并且还对中外邮票设计进行了比较研究,再加之对我国邮票视觉设计的演变进行分析,从而找出在
粉末渗锌是利用热扩散方法在钢铁表面获得锌铁合金层的化学热处理工艺,所获得的锌铁合金层即为渗锌层。渗锌层可作为牺牲阳极对钢铁基体起保护作用,并且其消耗速率较纯锌低,