论文部分内容阅读
作为金融市场的重要组成部分,股票交易市场在经济的发展过程中起到了非常大的作用。2015年以来,伴随着我国A股市场的起伏,投资者的行为也由一开始的热情转为更加理性的交易。因此,研究股票预测,并给出合理的投资建议,成为越来越热门的研究课题。传统的股票预测研究通常从股票市场的相关技术指标入手,而对于影响股票市场的投资者情绪等噪声因素,通常也是由股票市场的指标间接反映,对于股票预测来说,通常并没有特别好的效果。随着以web2.0为核心的网络技术的发展,越来越多的投资者开始从网络上发表一些自己对于股市的看法,并与他人的看法进行意见交换,这些原始的投资者观点就为我们研究投资者情绪提供了契机。本文首先抓取了股吧中的股评信息,利用支持向量机(SVM)将这些股评分为看涨、看跌、中立三种情感倾向,然后统计得到每天投资者对于某只股票的情绪指数。用这两个指数作为股票市场预测研究的重要特征,我们构建了MI-SVM预测模型和SS-SVM预测模型,分别对大盘的收盘指数和部分股票的收盘价进行支持向量机回归分析,得出了SS-SVM模型优于MI-SVM模型的结论。本文的工作内容主要在以下几个方面:(1)了解情感分类的基本原理,理解文本的向量表示原理,在此基础上提出了基于文档结构的特征权重计算方法,将该方法应用在文本表示中,得到了不错的分类结果。(2)利用股吧中帖子的阅读数和回复数构造投资者关注度,以情感分类结果作为帖子的情感倾向,综合计算得到情感指数和意见分歧指数。(3)了解股票预测的原理,并构建了两个股票指数的预测模型,一个仅考虑股票市场的基本技术指标,另一个综合考虑股市的技术指标和投资者情绪,对比两个模型的预测结果与真实情况的拟合程度。在本文实验中,得出了考虑投资者情绪指数有利于提高股票指数预测精度的结论。