论文部分内容阅读
当今世界,金融市场经济日益发展,金融财经吸引了更多的投资。但是,经济危机、次贷危机、金融风暴等风险频繁发生,金融投资中的各类不确定性更是日益增加。因此,金融方面的预测研究越来越受到业界研究人员的高度重视。投资者期望通过对金融市场的预研以及判断,掌握发展趋势和规律以达到指导自己在金融市场内的投资行为。本文针对金融市场对金融品种价格预测的需求,针对目前网络大量充斥金融财经新闻的情况,深入分析财经新闻对金融市场的影响,并通过分析金融财经文本信息所包含的情感倾向以及情感强度,结合金融财经市场内各类历史数据信息对金融市场价格发展趋势进行预测。预测过程中,首先使用多元线性模型进行初步处理,获取到初步预测结果,以及初步的预测残差序列,然后使用差分自回归滑动平均模型进行对残差进行纠正的组合模型。最后使用Spark技术优化预测过程性能,并取得良好效果。本文主要研究内容有:(1)提出了一种基于金融财经文本信息,结合组合模型,预测金融财经市场发展趋势的方法。首先,对采集过来的新闻,通过自定义的带有反映金融情感信息的情感倾向词库,以及自定义的语义规则,获得每篇财经新闻文章的情感值,从而获得每一天针对某一金融品种的情感态势。然后,基于财经新闻和金融历史价格数据结合预测的情况,提出首先使用多元线性回归进行初步预测,最终通过使用差分自回归滑动平均模型进行残差纠正的组合模型进行预测,获得预测结果。(2)提出了一种使用Spark Streaming技术快速获取金融财经市场情感倾向值的方法。由于金融财经文本信息,数据量大,处理过程复杂,情感倾向值信息获取的过程对计算机性能要求较高,为改善预测性能,在Spark环境下下运行情感值获取过程,获得更好的速度性能提升。(3)基于本文提出的结合金融财经文本信息以及金融市场历史数据的预测方法,构建金融市场发展趋势预测系统。展示本文中的预测方法所得的结果的同时,更好的为广大投资者创建一个指导投资的平台。