论文部分内容阅读
随着互联网金融的快速发展,越来越多的投资者将目光转移到了互联网社交平台上面。不只是因为它可以更加方便的为投资者提供及时的行情信息,提供交易渠道,方便投资者进行股票交易,同时也因为它在提供这些服务的同时,也成为了一个金融社交信息的共享平台。大量而即时的社交数据呈现在投资者面前,那是否可以通过它对股票的价格波动做出一定程度的预测,其中哪些社交因素对股票价格波动的影响更大,是否可以基于预测模型帮助投资者改善投资策略,这是本文的主要研究内容。本文的主要研究对象是雪球网、新浪财经、微博、东方财富网等互联网金融平台。首先通过对国内研究中重视网络舆论分析,缺少对其他社交数据研究的现状,提出研究假设,找到并发掘在互联网环境下对股票价格波动更具影响力的因素。然后,根据研究假设去有针对性的爬取相关的社交数据,对非文本数据进行结构化处理,对文本数据建立情感语料库,识别情感特征。之后,选择合适的智能算法构建特征模型验证假设,建立预测模型,并能够以一定的精度对股票价格的波动进行预测。研究结果表明,存在一些类似于股票新增关注程度的因素对股票的价格波动的影响比舆论分析所体现的情感因素更强,这些数据对股价波动产生的影响可能是因为即时的社交数据反应了该段时间内,投资者对股票市场发展的态度,并将这些因素与文本情感特征结合起来利用Boosting算法建立预测模型,在预测股票价格波动的同时,说明所选社交数据对股票价格波动可以起到预测作用。并且,研究发现当天所收集的数据对下一个交易日的影响程度最深,并随着时间的增长呈递减趋势。本文为研究社交数据和股票价格波动间关系提供了一定程度的贡献,丰富了该领域的理论,并为该领域的研究提供了新的思路和方法,此外,能够为投资者提供有价值的预测模型作为参考。