基于注意力机制的联合事件抽取算法与应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wpqh918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代信息体量的爆炸式增长,投资者难以快速从海量的金融新闻文本中获取有价值的投资信息。论文以金融新闻文本为研究对象,对事件抽取技术展开了深入地研究,构建了一个面向金融领域的新闻事件抽取系统,以便帮助投资者从海量的新闻文本中快速获取上市公司事件信息。主要的研究工作如下:提出了基于注意力机制的联合事件抽取算法。该算法使用ERNIE与BiGRU作为共享编码层,通过序列标注的方式识别出触发词之后,改进注意力机制,将触发词的特征作为注意力机制的查询向量,强化事件触发词与事件元素之间的关联,提高对事件元素的识别效果。实验结果表明,基于注意力机制的联合事件抽取算法训练的模型在事件元素抽取任务中F1值达到了67.4%,有效的提高事件元素的抽取效果。为了解决数据稀少的问题,提出了基于伪标签的数据增强算法。一方面,传统的数据增强算法在标注数据时太过肯定,会引入大量的噪声数据;另一方面,采用人工标注的方式,往往数据集规模较少。对此,研究并提出了一种基于伪标签的数据增强算法,通过知识库链接与半监督学习获取未标注数据的伪标签,使用置信判别对伪标签筛选,实现数据增强。实验结果表明,基于伪标签的数据增强算法训练的模型整体F1值达到了72.8%,相比于半监督学习与知识库链接的数据增强算法,能更有效的获取到高质量数据。设计与开发了一个面向金融领域的新闻事件抽取系统。将以上算法应用到实际项目中,使用Django框架构建了一个面向金融新闻文本的事件抽取系统。从实际运行测试情况来看,系统能够快速准确的抽取新闻中上市公司的相关事件信息,实现了预期功能。
其他文献
随着智能合约愈加广泛的应用,以太坊等区块链系统中出现了大量的庞氏骗局、蜜罐骗局等利用恶意智能合约实现的欺诈活动。基于神经网络智能合约源代码分类工具容易受到对抗样本攻击的欺骗,恶意智能合约创建者可能会通过对抗样本的方式来规避检测。现有的代码对抗样本生成技术可以使用替换一个或多个变量名的方式来让特定模型产生错误的分类结果,但是这些方法没有考虑如何在修改变量名以添加扰动时,降低扰动隐蔽性的问题。特别是对
学位
关系抽取技术可以从非结构化文本中抽取出结构化信息,是构建信息知识库最重要的环节之一。中文语料数据来源多种多样,关系事实交错复杂,且由于某些领域的数据敏感性,领域内缺少大规模公开数据集,给关系抽取提出了新的挑战。因此,以某领域为例展开了关系抽取模型的研究与应用。设计了一种联合关系抽取模型。在语义表征方面,针对领域内关系抽取任务的特点,通过改造预训练过程的遮盖操作,使用领域内的新闻语料和百科知识进行再
学位
传统的线下教学评价可通过教师之间的听评课进行,评课者针对不足提出改进意见,但说法一般较为笼统、委婉,针对性不强。当前教师听评课中“课堂观察”模式的效用最高。本文以一节公开课为研究对象,利用课堂观察的六大维度对课堂进行评价,形成观察报告,教师通过查看报告反思自己的教学行为,从而改进教学。
期刊
<正>数学概念一般都抽象难懂,对于以直观形象思维为主的小学生来说理解起来非常不容易。在教学中教师要基于学生的年龄特点和生活经验设计教学活动,引导学生亲历概念的建构过程,促使学生理解概念本质,使学习真正发生。“三角形的内角和”是人教版四年级下册的教学内容,是在学生认识了三角形的基础上进行教学的,是进一步研究平面图形性质的基础,是对三角形从感性认识到理性认识的一次提升,是对几何图形从外在特征认识到内在
期刊
文本分类是自然语言处理中的一个重要任务,在文本相似性分析、问句匹配以及自然语言推理等应用中都发挥着重要作用。新闻分类是文本分类中一个热点问题,受到了研究者们的广泛关注。新闻文本因其结构层次的差异性、标签种类的多样性以及高质量标注样本数量的有限性,相比于普通文本,在分类处理上更加具有挑战。通过分析新闻分类中的难点,以卷积神经网络文本分类模型与长短期记忆网络文本分类模型为基础,提出一种基于层次语义与先
学位
新课程改革背景下,要求教师发挥数学课堂育人价值,促进学生核心素养的发展。基于此,教师要重视数学活动、变式训练、思想点化的作用,创新课堂教学模式,发展学生的核心素养。
期刊
跌倒是全球第二大意外伤害死亡原因,在跌倒后及时进行救治,可以极大地减少由意外带来的伤害和损失。传统的跌倒检测方法主要基于可穿戴设备或光学设备,在使用场景或舒适性上受到了很多的限制,而利用无线信号的信道状态信息(Channel State Information,CSI)可以实现无接触的跌倒检测。近年来,虽有许多工作提出了基于CSI的无接触跌倒检测方法,但是这些方法容易受到环境变化的影响,在部署至新
学位
脊柱生理曲度和侧弯是脊柱畸形评估的关键指标,在临床诊断中往往需要对受检者进行X光片拍摄后由医生手动进行指标测量,具有一定的危害性和不确定性。使用深度相机捕获人体图像,并开发一套脊柱畸形检测系统,能够帮助医生快速、准确、无害、高效地诊断脊柱畸形。运用深度学习和图像处理相关技术,设计并实现了一套脊柱畸形检测系统。该系统使用Kinect相机采集人体背部表面的深度图像和彩色图像,采用区域生长的方法提取人体
学位
<正>《数学课程标准(2022年版)》指出:“数学在形成人的理性思维、科学精神和促进个人智力发展中发挥着不可替代的作用。数学素养是现代社会每一个公民应当具备的基本素养。”为有效地提升学生的数学素养,转变学生的学习方式,让学生进行审辩式学习是一种有效的途径。穆传慧老师对审辩式学习进行了系统研究,从一个中心、两个理念、三类素养、四种思维、五学课堂、六项评价等维度进行有理念、有工具、有正确价值观的结构性
期刊
信息物理系统是一种以传感器作为终端设备,感知外部坏境变换,并针对外部环境变化做出响应的计算机系统。在一些特殊场景中,系统所监视的外部对象具有可容忍响应时间属性。一旦所监视对象的状态发生了改变,系统需要在可容忍响应时间内,完成对于此变化的响应。例如,一旦高压电线路中的电压超过额定值,高压电监控系统需要在10毫秒内完成断电操作。现有信息物理系统响应时间控制策略均以降低系统平均响应时间为设计目标,不支持
学位