基于财经新闻情绪指数和多核学习模型的股指趋势预测研究

来源 :海南大学 | 被引量 : 0次 | 上传用户:woyingla
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票市场是一个国家重要的投融资场所,也在一定程度上反应了一个国家的宏观经济水平。其中,股票价格指数作为指引近期股票市场状况的风向标,对其进行预测和分析一直是学者研究的重点。引起股市及其相关指数变化的因素是多种多样的,包括了宏观经济形势、国家相关政策、企业经营状况、社会舆论导向等等。这些因素构成了多来源且类型不同的数据信息,其多样性和复杂性增加了股市预测研究工作的难度。如今,在股市预测研究领域中,研究的重心从基于股市历史价格信息的传统自回归计量模型发展到利用多种来源数据的融合模型。例如,学者们结合行为金融学理论,将财经新闻报道、公司公告、分析报告、股吧股评等反映公司基本面状况的信息融入到股票的预测研究中,研究发现这些信息会改变市场主体的对未来市场的心理预期从而影响市场主体的投资决策行为,并以此衍生出文本的表征方法和文本情感量化方法。同时,在预测方法上,从传统计量模型发展到人工智能领域日臻成熟的深度学习方法。研究者在对股市预测的精度和模型的智能化方面都取得了较大的进步。在基于多来源数据的股市预测研究中,目前主要面对以下挑战:1)针对不同来源数据的处理和特征提取的困难,例如财经新闻作为一种非结构化的文本数据,自身具有专业性、客观性、无标注的特点,对其蕴含的语义信息以及情感倾向进行量化往往十分困难;2)股票市场是一个呈现非线性波动的复杂系统,而在前人研究中,往往基于单一来源数据构建股市预测模型,使得多来源数据信息往往利用不够充分,另一方面,多来源信息的引入能增加模型信息源的多样性,从而提升模型的预测性能。因此,深入挖掘对股市变动有影响的信息,并构建能有效融合多来源数据的股市预测模型,从而以智能的方式反映出不同因素与股市波动之间的关联,仍需进一步的研究。针对以上问题,本文对前人研究中与股市波动关联度较高的信息源进行分析,最终确定了股票市场历史数据、汇率市场历史数据和财经新闻媒体报道三类不同的数据源。同时根据金融市场技术分析原理,挑选了股市和汇市中比较关键的技术指标特征,确定了技术指标特征与新闻文本类特征的构建方法。进一步,结合基于自然语言处理方法和深度学习技术,对采集的财经新闻文本进行了向量化表征,并利用情感分析方法提取了财经新闻情绪指数特征。最终,本文利用多核学习方法将构造的不同来源数据特征进行融合处理,并构建了多核股指趋势预测模型。从本文主要的探究内容来看,可以归纳为如下两个方面:(1)根据财经新闻文本客观性、专业性、无标注的特点,设计了面向新闻报道的情绪指数构建方法。该方法首先整合了现有金融领域情感词典,结合新词发现算法和提出的N-SO-PMI算法生成了财经新闻领域情感词典,接着利用生成的词典解决财经新闻无情感标注的问题,最终将已标注的财经新闻作为训练语料带入到神经网络情感分类模型中,根据模型预测概率计算得到财经新闻情绪指数。本文生成财经新闻情绪指数的方法与传统方法相比,更能准确表示财经新闻报道的情绪倾向。(2)由于多核模型在处理多源异构数据特征空间融合方面的优势,以及核函数能够灵活地将数据映射到更适合的高维特征空间进行表示。本文由此构建了多核支持向量机模型来对多来源经济数据进行特征融合并进行股指涨跌的预测。在模型训练过程中,针对多核时序模型超参数选择的问题,本文采用了最新基于滑动窗口的选参方式。最后,在实证分析中,本文将基于三种数据来源的股指涨跌的预测情况与基于单一数据来源的预测结果在不同预测周期下进行了比较,对比结果表明由多源数据构成的多类别特征数据集在预测中的表现更好;同时,通过比较不同预测模型在同一数据集上的股指趋势预测结果,发现多核支持向量机模型在多个不同预测周期下准确率都高于神经网络模型。总的来说,本文丰富了股市预测相关研究,总结并结合了股市技术分析学派、基本面分析学派、行为金融学研究理论,为基于多来源信息的预测模型构建研究和新闻量化分析提供了技术支撑。文章中还设计了财经新闻情绪指数构造方法,实证分析发现可将其作为股指波动的表征指标,此外,研究中生成的财经新闻领域内情感词典拓展了传统金融情感词典,能有效帮助研究人员实现对财经新闻的无监督情感标注,具有极高应用价值。
其他文献
过程体裁法是一种以学生为中心的综合性写作教学方法,旨在通过提供针对性输入让英语学习者根据目的展开写作,并在写作过程中开发学习者的写作潜力。写作效能感是指个体对其写作能力的感知和评价,它会对学生的学习行为、认知和情绪产生影响,进而关系到整体学习效果。本文根据高中英语教学实际在过程体裁法中融入提升写作效能感的教学方法,提出基于自我效能感的过程体裁法教学模式,探究过程体裁法对提升高中生英语写作效能感的作
学位
一直以来,对外贸易的高速发展极大程度上推动了中国经济增长。然而,以牺牲环境为代价的旧式经济发展模式也使中国生态环境濒临红线。一方面,为实现广大人民对美好环境的强烈需求,中国政府实施了一系列环境管制政策;另一方面,在逆全球化势力抬头和新冠肺炎疫情冲击的国际背景下,中国政府提出了稳外资、稳外贸的目标。新形势对环境政策的实施提出了更高要求。因此,客观分析国内环境管制加强如何影响出口强度对中国协同实现环境
学位
随着全球价值链的不断拓展和深化,中国近年越来越重视进口领域的发展,不仅拓宽了与贸易伙伴的合作渠道,也大大促进了中国对外贸易的全面发展。中国加入WTO以来积极承担大国责任和义务,进口关税已经大幅削减。然而,近年来虽然中国积极推动全球经济一体化与贸易自由化进程,但对外贸易却屡屡受阻,贸易摩擦应接不暇。在国际经济形势整体低迷的情况下,一些国家及地区从自身利益角度出发,采取了一系列的贸易保护措施以期促进国
学位
随着高中英语课程改革的不断发展,现代英语阅读教学遇到了“文选式”教学的现实挑战,教师对学生思维品质的养成关注度有所欠缺。因此,图形组织者作为解决问题的重要教学策略逐渐进入我们的视线。本研究以广东省广州市10所高中一线英语教师共245人为研究对象,采用问卷调查、访谈和课堂观察等研究工具对数据进行收集和整理,用以解决以下三个问题:第一,在高中英语阅读教学中,教师对采用图形组织者策略持什么态度?第二,在
学位
随着科技的进步,社会需要更多创新型人才,各国开始对培养创新性人才高度重视。2018年,《普通高中英语课程标准(2017年版)》正式颁布,明确提出了学习活动观是提升思维品质的途径。然而,英语教师对于学习活动观的认识情况是否会对学生的思维品质提升产生影响,值得进一步研究。因此,本研究首先对学生的思维品质发展现状进行调查和课堂观察,然后对高中英语教师学习活动观的认识情况进行问卷调查、访谈和课堂观察,最后
学位
由于中美贸易摩擦加剧,以及新冠疫情叠加的负面影响使经济衰退的预期增加,中国和东盟的合作日益紧密。2022年1月起,中国和东盟等15个国家全面实施《区域全面经济伙伴关系协定》(RCEP),这加速了15个国家间一体化发展。由于越南拥有低廉的劳动力成本以及西方国家给与的较宽松的贸易优惠条件等优势,中国部分制造业已转移到越南。那么,中国和越南近些年的产业发展状况到底如何?两国自身的要素禀赋能否实现产业升级
学位
随着互联网、大数据的不断整合发展,人们进入了知识时代和图像时代,获取知识的途径越来越多样化,收到的信息也越来越多,同时也给教学带来不小的挑战。在这样的背景下,笔者将知识可视化工具应用于初中英语阅读教学中,试图探究知识可视化工具的教学辅助作用。笔者首先通过文献研究,回顾了国内外知识可视化工具的研究现状、指出研究存在着对工具研究针对性不够等问题,阐述了理论基础并对知识可视化、知识可视化工具以及视觉思维
学位
依据初中生“尚象”心理及形象思维为主特点,本论文植入“象思维”与“脑科学”理论,以统编初中语文教材唐诗选文为文本依据,针对辽宁A市初中唐诗阅读教学存在问题,尝试探寻如何伴随“象”之兴趣实施更为有效的初中唐诗阅读教学策略。首先针对学生深度领悟唐诗主旨困难问题,论文探寻以“意象”为支撑点,挖掘其中寓意,类比迁移感悟唐诗主旨。为此,依据学界有关“意象”界定研究成果,笔者将教材唐诗选文意象分为“字象”、“
学位
随着经济转向高质量发展阶段,我国对各产业绿色发展、能源消耗及全要素生产率等方面都有了更高的要求,探究服务业绿色全要素生产率(ETFE)及其影响因素成为一个重要的课题。本文在深入分析ETFE的正式和非正式制度嵌入性基础上,依据多层统计模型建立了既能分析不同省域间影响因素效应差异性(影响因素的系数在不同地区存在显著差异),又能解决嵌入性因素间接影响问题的ETFE影响因素理论模型。在具体的实证分析中;首
学位
近年来,加快推进自贸区战略,逐步构筑起立足周边、辐射“一带一路”、面向全世界的自贸区网络已成为中国进一步对外开放的新课题。自贸区网络通过扩大对外出口和对内进口两种方式助推国内国际双循环,促进中国与FTA成员国之间的双边贸易。然而,事实上却是自“一带一路”倡议提出以来仅有少数沿线国家同中国签署FTA。为探究FTA签署对“一带一路”沿线成员国的双边贸易以及FTA如何影响沿线国家的双边贸易,本文以中国与
学位