股市舆情数据的挖掘与分析研究

来源 :兰州理工大学 | 被引量 : 7次 | 上传用户:zlmgwj006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科技的高速发展与网络数据信息的激增,数据挖据技术已经逐步成为信息时代下推动金融股票市场创新发展的核心力量。在股票市场中越来越多的股民投资者热衷于在网络论坛中交流股市投资心得,由此产生的非结构化股评舆情数据成为了影响股票市场健康发展的重要因素。在有关网络舆情数据与股票市场关系的各类研究中,传统的股市交易指标已经无法满足投资者把握股票市场运行规律的需求。本文基于机器学习和深度学习技术对股市舆情数据进行了挖掘与分析,力求解决股市舆情潜藏情感倾向挖掘能力不足以及相关交易指标预测结果不佳的问题,相关研究工作如下:1.使用爬虫抓取器,按照特定规则遍历解析东方财富网股吧网页评论信息及其它特定属性列表信息作为股市舆情数据源。借助多个处理工具对原始数据进行去噪声、去干扰以及分词、停用词过滤等预处理工作,在中文分词和特征矩阵构建的结构化过程中引入TF-IDF加权技术和Word2vec表达技术实现非结构文本的量化表示,以提高后续分类预测模型的输入质量与学习效果。2.以挖掘股市舆情数据的情感倾向作为研究目标,基于朴素贝叶斯和卷积神经网络两种思想构建股评舆情数据情感倾向分类器,根据分类器评测指标对比分析了两种分类器的分类效果,结果表明,基于卷积神经网络的股评舆情数据情感倾向分类准确率高于朴素贝叶斯情感分类器,进一步证明了卷积神经网络在股市领域对股评舆情情感倾向分类的准确性。3.研究了股评舆情数据中潜藏情感信息结构化权值强度对股票交易指标成交量的影响,研究结果表明,通过情感词典匹配计算得到的交易日股评舆情情感值在某种程度上可以对相应股市交易日的成交量指标进行行为预测,并较为真实地反应一定时间内股市成交量的走势情况。4.基于支持向量回归机和BP神经网络两种方法,研究了股市舆情数据对股票收益率的影响,并对两种方法的性能评价指标进行了对比分析,结果表明,两种模型的学习结果均能预测股市收益率及其走势情况,且支持向量回归机模型的预测误差小于BP神经网络,进一步验证了支持向量回归机模型在预测股市收益率时可以产生优于BP神经网络的预测结果。
其他文献
美丽乡村建设是当前社会主义发展过程中急需解决和思考的问题,随着人们生活水平的逐渐提高以及城市化建设的完善,乡村环境发生了巨大的改变,如何让乡村生活变得更加美丽,还给
适期播种是棉花丰产的重要措施,品种类型常影响播种期。为确定不同类型棉花品种的适宜播期,采用裂区设计,以品种类型(早发型鲁棉研21号和后发型鲁棉研28号)为主区,播种期(4月上旬早
目的设计一种新型内镜连续止血闭合器械,并进行有限元分析,验证其是否满足实现组织闭合功能的设计要求。方法在器械抓钳聚拢目标组织后推送金属夹,使其部分穿透组织,通过金属
研制出了双烯封端棒状聚酰亚胺,并用其改性BT树脂,制得了低收缩BT树脂/石英布覆铜板.其平面方向热膨胀系数为3.1×10-6℃-1,厚度方向为1.3×10-5℃-1,优于国外同类产
文章通过固态发酵与液态发酵的对比,分析了固态发酵技术的特点和优势;简要介绍了固态发酵目前的应用现状,对固态发酵的发展前景进行了分析和展望。
介绍了恒温环境的建立方法,设计了一种小型化、便携式的恒温槽并详细介绍了其组成结构与工作原理。从设计角度出发,提出了避免因温度场的不均匀性而给检定结果带来系统误差的
<正>随着电视市场的商业化,电视剧的"娱乐"功效已经成为一股势不可挡的风潮,这种将创作的着眼点放在"娱乐"和"戏说"上,放弃对于常规化生活以及广泛民间群体的关照的选择,是对
本研究主要针对环境雌激素对雄性动物生殖机能造成的损害,并结合当前ICSI技术是否会对胚胎发育产生致畸作用尚存在争议,利用实验动物载体的优势条件,拟采用已证明具有环境雌激素
大学生心理健康教育越来越受到国家教育部门和各高校的重视,但高校的心理健康教育工作仍然存在着制度不健全、师资力量薄弱等一系列问题。针对这些问题,积极地探索科学有效的应
采用X射线衍射仪(XRD)、扫描电镜(SEM)、透射电镜(TEM)、电化学测试等手段,研究了淬火温度对集装箱用30Cr13耐候钢的组织转变、未溶碳化物特征、耐腐蚀性能的影响,并分析了腐蚀机理