基于多特征的细粒度情感分析

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:wqra555551q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络模型通过构造非线性网络结构去捕捉文本中的情感特征,在文本情感分类任务有着不错的表现。但是该类方法有着诸多值得改进的地方。(1)每个模型凭借自身的特点抽取不同的特征,如何设计一个模型去利用这些特点去尽可能多的捕捉情感特征,避免文本信息的浪费值得研究。(2)用户评论往往并非长篇大论,而是简短有力的短文本,如何在较短的文本量下提高情感分析的准确率。(3)如何针对文本中不同的对象进行情感分析,而非对整个句子进行情感分析等等。针对以上问题本文展开如下研究。(1)提出多特征提取模型以解决粗粒度情感分析。本文提出多特征提取模型(Affective feature pre-extraction model,AFPEM),从词语固定搭配、关键词汇、上下文信息等各个维度出发,利用各类模型的特点提取不同的情感特征;中文文本因为其特殊性,进行情感分析时需要分词操作。网络用语、地名等新词的出现使词嵌入模型无法达到预期的效果。因此本文提出字词融合机制,在词向量基础上引入字向量,通过自适应模型使二者融合,提高词嵌入模型的可用性。实验结果表明,AFPEM模型对情感分类准确率的提升有所贡献。(2)提出双向注意力模型,提高对象与文本的交互能力。对于细粒度情感分析,对象词汇与短文本之间是存在关联的,本文提出基于对象交互的双向注意力模型(Multi object interaction model,MOIM),计算对象词汇中各个词与文本中的各个词对于双方的重要程度,并根据重要性调整自身词汇的权重,以达到文本与对象交互的作用。将对象词汇进行预处理,提高对象词汇的辨识度,有利于后续的情感分类。提出改良版的损失函数。针对不同的错误分类给予不同的惩罚力度,提高模型的训练速度。本文设置对照实验验证以上观点的可行性,提出一个通用的模型结构以提高细粒度情感分类的准确率,并将其应用于《上海市高等学校计算机基础教学资源平台》网站。
其他文献
在大数据和深度学习发展的推动下,文本图像识别对人们的日常生活产生了重要的影响。本文围绕文本图像识别任务,在基于编码器-解码器的文本图像识别模型的基础上进行研究并加以改进。具体来说,在编码阶段分别采用基于注意力机制的特征提取模型和基于时序卷积的模型来完成视觉特征的提取和特征序列的建模;采用基于多层次特征的聚合机制来聚合不同层次的信息;解码阶段利用启发式局部注意力机制完成字符序列的解码。首先,文本图像
学位
学位
2018年初《普通高中生物学课程标准(2017年版)》正式公布,新一轮的基础教育课程改革在借鉴国外成功经验的基础上,研制了我国高中生物学课程设计的宗旨——生物学学科核心素养。这样的教育目标体现了国家意志和社会发展对生物学科培育人才的价值需求,也是学生在学习生物学的过程中需要逐步形成的生物学观点、思维方式和解决人类生活问题的技能。如何在将核心素养渗透到课堂教学中,实现新课标的要求和学科的育人价值,是
近年来,闪存存储设备凭借其高性能和低功耗等诸多优势,被广泛应用于个人电脑、服务器、数据中心、移动设备中,是一种非常有前景的存储设备。然而,闪存存储设备拆解和开发难度大、成本高,想要通过真实设备进行学习和研究都非常困难。仿真是一种经济便捷的替代方式,目前学术界已经有多款功能强大的闪存存储设备仿真软件。然而这些仿真软件都是为专业人员设计的,主要用于研究,软件的使用需要建立在熟悉闪存存储设备的基础上,学
环境感知是工程车辆智能化的基础,检测路面的障碍并进行尺寸估计有助于规避潜在的危险,降低事故的风险。基于激光雷达的三维目标检测技术已日渐成熟,然而激光雷达昂贵的价格限制了相关技术在实际工业生产、生活中的落地。针对此问题,论文提出使用常见的单目摄像机替代昂贵的激光雷达。首先通过构建自监督的单目深度估计模型预测深度图,然后将其转换为伪点云,最后基于伪点云实现道路障碍的检测与尺寸估计。针对深度估计和伪点云
伴随着互联网的快速发展,非结构化的文本数据快速增长,如何高效精准地定位关键词,成为了我们探索的一个重要科研方向。作为信息抽取的主要研究方向,关系抽取正在知识图谱、网页搜索等方面发挥着巨大的作用。得益于启发式的远程监督方法,远程监督关系抽取可以在无需人工帮助的情况下自动识别实体对关系。随着机器学习和深度学习的快速发展,关系抽取利用卷积神经网络提高了预测的准确率。尽管如此,现有的模型依然存在以下问题:
近年来,机器翻译技术的快速发展为不同国家人民之间的交流带来了极大的便利。机器翻译指将一种模态的语言表示转化为另一种语言表示,常见的机器翻译技术将源语言的文本或者语音信号翻译成目标语言的文本。但是,由于语言的多样性和语义表达的歧义现象,仅仅依靠单源信息作为输入的神经机器翻译模型常常发生错误翻译。随着多模态学习和相关交叉领域的发展,不仅文本可以和图像信息或者词性信息等知识相结合,不同模态之间的信息互补
学位
在对外汉语教学中,留学生的语言技能培养包括听、说、读、写、译等各方面,最终的教学目的是培养和提高留学生的汉语运用和交际能力,因此,口语教学在对外汉语教学中始终占据着无可替代的地位,尤其进入高级阶段后,对留学生的语篇表达能力提出更高要求。因此,如何有效提高高级口语课堂中留学生的参与度、学习积极性和语篇表达能力成为了目前需要解决的问题。国内已有一些学者借鉴国内外语言课堂的模式,将合作学习引入对外汉语教