基于文本对抗的开放式问题答案评分方法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hunterring1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
开放式问题答案评分任务属于自动文本评分任务中的特殊分类。与一般的自动文本评分任务相比,开放式问题往往没有标准答案,所有符合回答完整、切合题意、语言流畅等条件的答案都可以算作优秀答案。为了能给开放式问题的答案进行更客观高效的评分,有必要建立相应模型对开放式问题的答案进行自动评分。目前已有的自动文本评分模型大多依赖于知识特征和标准答案,需要大量的人工标注,难以对没有标准答案的开放式问题进行准确评分。因此本文使用深度学习模型,利用文本对抗思想,以较少的标注文本对开放式问题答案评分任务展开研究,提高模型在该任务中的性能。本文将一个以文本对为输入的分类模型作为开放式问题答案评分任务的基础模型。它能自动对输入的文本对进行评分,最后输出分类结果,有差、中、好三个类别。本文提出了ATQA模型,使用基于梯度的白盒对抗训练方法,在输入文本的词向量空间中添加扰动来提高模型的整体性能,使用类平衡损失函数解决了类别不均衡的问题。在中文数据集上,相比于使用其它对抗训练方法的模型,ATQA模型的准确率提高了1.04%。因为标注文本的获取成本较高,为了能更好地扩充数据,本文提出了Auto Gen方法,将对抗扰动生成为文本来对原数据进行数据增强。具体方法是利用自编码器结构,将基于梯度的连续扰动映射到离散的文本空间上,以数据增强的方式,将Ro BERTa模型的准确率提升了1.82%。此外,Auto Gen方法生成的文本是对原文本进行句子级别的扰动,在保持句子原意不变的情况下,对句子进行了增添、修改、替换等多种操作,相比于其它对抗文本生成方法,变换更丰富。本文以真实的应用场景提炼相关数据集,并用提出的方法在该数据集上进行实验验证。实验结果表明本文提出的方法可以提高模型的性能,有效地完成开放式问题答案评分任务,并获得实际应用。
其他文献
随着我国经济社会发展方式的全面转型,高质量发展、高品质生活已成为新时代发展要求,坚持以人为本的城市规划,要让人民群众有更多的获得感。因此,需要我们对城市公共服务设施配置进行不断的完善,促使人们的需求能够得到最大程度的满足。教育设施是城市公共服务设施的重要组成部分,对中小学的空间布局合理性及落地实施进行研究,不仅有助于实现教育设施的公平性与均等化,使其更好地适应城市的变化以及民众的需求,还有助于完善
DL工程公司成立于1998年,是首家将非开挖各种技术方式中的水平定向钻铺管技术(Horizontal Directional drilling)(以下简称“HDD”或“HDD技术”)在中国应用的公司。当时HDD技术在国内还是一个非常陌生的、绝大多数建设单位、设计单位以及施工单位对此一无所知的技术。DL工程公司的创业团队的主要力量是来自高校的专业教师,凭借他们对HDD这项新技术的消化理解能力,迅速建
伴随着中国生态环境保护理念与城市建设中底线意识的加强,扩张式的城市化发展进程受到一定限制后,进而转向内部存量空间优化。城市滨水空间成为当下城市空间更新与活力重塑的热点。但是,由于缺少城市滨水空间活力理论的引导,许多城市滨水空间的提升依旧停留在单纯的物质景观设计上,既缺少从中观层面对城市滨水空间系统的研究,也忽视了城市滨水空间与居民日常休闲活动的关系,从而导致了城市滨水空间活力不足的问题。因此,笔者
随着国家经济实力提升,农村经济增长,村镇银行的综合实力在一步一步提升。尽管村镇银行得到了发展,但受限于村镇整体的金融市场不发达,金融运作手段主要以信贷为主,抵押类贷款更是信贷业务中的核心业务。随着银行同业间竞争日益激烈,为了能够在竞争中保持足够的市场份额,村镇银行对信贷审批对象放宽政策,导致了较多抵押类不良贷款的产生。如何加强抵押类不良贷款的管理成为了村镇银行目前急需解决的问题。本文基于分析H村镇
旅游业在世界经济中的地位日益重要,在许多国家的长期经验基础上,已成为许多发展中国家最重要的出口部门,这些国家通过旅游业维持和改善国民经济,在柬埔寨迅速发展,为柬埔寨的发展做出了重要贡献经济。目前,国际旅游无论是在提供新的职业机会方面还是在许多国家作为交换收入的基础,都已成为主要问题之一。由于旅游业是外汇的主要来源,它提供了积极的外部性并为实体部门创造了附加值。它鼓励资本积累和开展新的投资活动。国际
随着第24届冬奥会落户北京,我国冰雪运动发展迅速,越来越多的人参与到冰雪运动当中,选择冰雪旅游也成为了一种时尚。冰雪运动产业蓬勃发展,随之而来“互联网+”冰雪运动平台也具有极大的市场前景和开发潜力,但是整个“互联网+”运动产业还存在提供内容服务单一、线上线下脱轨严重、用户活跃度低、缺少盈利模式等诸多问题。本论文以“中国雪托帮”平台为研究对象,对平台的运营管理策略进行研究,结合国内外冰雪运动和文化旅
近几年来,中国制药企业面对的不仅仅是与国际市场接轨后产品的竞争加剧,从国内行业发展现状看,还面对着医疗体制改革过渡期的政策环境变化。尤其是2015年以来,国家出台的政策对制药企业特别是中药企业带来的宏观压力是前所未有的,一方面,国家面对诸多医疗体制改革的诸多难点问题,另一方面,中药产品的特质严重影响其参与国际市场竞争,其中,以中药化学成分不清为代表的“先天不足”,为中药走出国门设置了难以逾越的门槛
我国已然成为举世瞩目的“建筑大国”,且建筑业的发展对国民经济的增长及社会民生的改善起到举足轻重的作用。但我国建筑业企业普遍面临利润获取能力偏低的困境,究其根本,往往不是因企业施工技术落后、管理制度缺失等原因,更多的是对处在施工一线的工程管理团队建设不合理,导致其管理能力偏弱,从而限制了企业获取利润的空间。本文选取CSCEC1041工程管理团队为研究对象,在对能力评价理论进行梳理和分析的基础上,阐述
基于视觉信息的多模态机器翻译是指在文本机器翻译的基础上,以图像或视频的信息作为辅助帮助模型理解上下文从而提高机器翻译系统性能。通常的方法是在编码端将两种不同模态的信息融合。本文针对基于视觉信息的多模态机器翻译的两个子任务文本-图像机器翻译和文本-视频机器翻译进行研究,分析了该领域存在的问题:一是缺乏统一的多模态机器翻译框架能通用地适用于两个子任务;二是在图像信息中存在着与文本无关的内容,冗余的图像