数据挖掘在股市趋势预测的应用研究

被引量 : 0次 | 上传用户:xurikeji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的日新月异,使得数据的大规模增长,如何充分利用这些海量数据进行分析处理,挖掘并析取其背后蕴藏的价值信息,对于我们揭示事物发展规律变化的内部规律,发现不同事物之间的相互关系,为人们正确认识事物和科学决策提供依据具有重要的实际意义。数据挖掘技术为人们提供了强大的武器。聚类分析是数据挖掘研究的一个重要内容之一,基于聚类的各种数据挖掘算法的研究历来也是研究重点,并且对聚类的各种数据挖掘算法应用也非常广泛。但是,目前大多数的聚类分析算法的数据对象只是针对于静态数据集,对于动态数据集却只能采取对整个数据集重新进行聚类的方式,因此随着数据量的不断增大以及对数据集实时数据挖掘的需求不断加大,这样处理的结果是效率低下而且重复性高。现实股票市场中存在着许多不确定因素,这些不确定因素使股票交易者很难对股票价格做出准确、客观的预测。本文的数据对象是采用来自互联网的1990年3月27日到2005年3月27日每日恒生指数的数据,数据格式采用国际上通常讲的股票历史数据格式,即是每一“交易日”为一条数据记录单元。通过随机选取的一个股票对象的属性进行对整个恒生指数的概述,其中每个属性都经过了数值化变换。要得到的聚类结果为:股市走势类别分组聚类。这个问题可以转换成股票走势特征极大化。基于聚类的下降迭代增量式数据挖掘继承了已有聚类的执行成果,通过对新增数据的考查,迭代求取最佳可能值,根据实例数据对象特征以及本文提出挖掘算法的聚类特点,在实际实验结果的验证下,可以得出本文课题是可行和有效的。同时本课题提出的算法可在很大程度上避免大量的重复计算,减少了计算量,节省了系统开支,提高了效率,尤其数据量越大时,下降迭代增量式的数据挖掘技术就越能体现出其优越性,也更能为有数据挖掘需求的用户提供及时、快捷、有价值的信息内容。股票的趋势是一个受政治局势、灾害、军事局势、企业经营、股票历史数据等多方面因素影响的非线性问题,本课题基于股票市场产生的大量数据,利用基于聚类的下降迭代增量式的数据挖掘技术对股票趋势进行预测。模拟结果再现了股票市场尖峰肥尾,弱自相关性,波动聚集性以及多重分形性等特征,并与恒生指数实际数据进行了比较。
其他文献
城市道路交通是一个错综复杂的交通大系统。包括城市规划布局、道路建设、管理体制、投融资体制、交通需求管理、公共交通运营组织、交通方式选择、交通流量控制与管理等方面
采用电感耦合等离子体发射光谱法测定铜尾矿中铅、锌、砷、锑、铋、镁等6种元素,其测定范围ω(Pb):0.10%~2.50%;ω(Zn):0.50%~3.50%;ω(As):0.05%~0.35%;ω(Sb):0.01%~0.30%;ω(Bi):0.008%~0
文章研究零修正广义线性混合模型拟合重复观察零膨胀计数数据,分别介绍零膨胀模型、跨栏模型和零调整模型这三类零修正模型。为了处理重复观测数据的相关性,同时对零值参数和
如何更好地拟合保险赔款数据,一直是保险精算研究的热点问题。文章研究偏正态分布和偏t正态分布是否可以拟合尖峰厚尾的保险索赔数据。由于这两个分布的密度函数比较复杂,文
采用电感耦合等离子体原子发射光谱法(ICP—AES)测定了锌精矿中Ca,Mg,Cu,Pb,Fe,As,Cd,Sb八种元素的含量。其测定范围:0.1%≤ω(Ca,Mg,As,Cu,Pb)≤5.0%,0.05%≤ω(Cd)≤2.0%,1.0%≤ω(Fe)≤10.0%,0.03%≤ω(Sb)≤0.5%。
民众的教育政策公平认知包括公平感受和公平观念两部分内容,会受到多种因素的影响,对于教育政策的设计与调整具有重要作用。基于一项全国问卷调查数据,从义务教育和高考制度
S102省道与铁山支线交叉处原为有人看守道口,为缓解交通压力,需顶进地道桥。本桥设计过程中,充分利用既有2-7.0米框架桥,合理选用D型便梁支点进行线路加固。通过合理安排施工工序
点火线圈是点火系统的关键部件,其品质水平直接影响着汽车的运行安全,因此有效识别出生产缺陷的产品是非常必要的。本文首先对点火线圈的结构特点、生产工艺、失效模式以及行
近年来,语言研究者和教师开始关注学习者的个体差异,如年龄、语言水平、学习动机、认知风格等。其中认知风格和学习策略一直是研究者关注的焦点。有关认知风格与学习策略的相
为进一步研究环状仲胺系酰胺萃取剂的萃取性能 ,完善萃取剂结构与性能关系的萃取理论[1,2 ] ,合成了一种新型萃取剂N -辛酰 - 2 -甲基哌啶烷 (OMPPD) ,并利用红外光谱、质谱