【摘 要】
:
隐喻是一种常见的修辞方式,可以增强语言的渲染能力,提升感官体验,促进说者与听者的共鸣。除了修辞层面上的功能,隐喻更是人类的一种认知手段和思维方式,是人类概念系统塑造的基础。认知和修辞上的功能使得隐喻活跃于各类自然语言交流场景中,同时大量隐晦含蓄的隐喻表达也成为了自然语言处理任务必须直面的一个难点。隐喻计算包括隐喻识别与隐喻理解两大模块。隐喻识别旨在对语料中的隐喻表达加以区分,供后续的隐喻理解模块处
论文部分内容阅读
隐喻是一种常见的修辞方式,可以增强语言的渲染能力,提升感官体验,促进说者与听者的共鸣。除了修辞层面上的功能,隐喻更是人类的一种认知手段和思维方式,是人类概念系统塑造的基础。认知和修辞上的功能使得隐喻活跃于各类自然语言交流场景中,同时大量隐晦含蓄的隐喻表达也成为了自然语言处理任务必须直面的一个难点。隐喻计算包括隐喻识别与隐喻理解两大模块。隐喻识别旨在对语料中的隐喻表达加以区分,供后续的隐喻理解模块处理;隐喻理解则力求将隐喻文本转换为对机器处理更友好的等价表述,减少或消除隐喻歧义和矛盾语义带来的不确定性,帮助机器理解隐喻。然而,前人的工作大多单独面向隐喻识别或理解的其中一项进行,两个本应具有承接性的模块在相关研究中通常是割裂的。本文分析了当前一体化系统难以实现的原因,并分别构造适用于一体化系统的隐喻识别与理解模型,达成识别与理解两大模块的衔接,实现隐喻计算的一体化。在隐喻识别模型构建中,本文认为传统的文本二分类隐喻识别模式仅能标注出某个句子或短语是否包含了隐喻用法,不能深入到词语层面进行识别,无法为理解模块提供足够支持。因此本文提出将隐喻识别视为序列标注任务,基于预训练语言模型进行粒度更细的词语级别隐喻识别,通过标注出句子中具有隐喻倾向的词语,为后续的理解提供支持。在隐喻理解模型构建中,本文对隐喻研究中的经典互动论和隐喻合作机制进行了扩展,提出“潜在合作”的构想,基于合作机制对隐喻词、隐喻释义和上下文进行建模。模型通过建立语义域间的潜在关联,选取使潜在合作意愿最强的释义作为隐喻理解的结果,具有较好的可解释性。综上所述,本文设计了适用于一体化系统的机器自动隐喻识别与理解模型,并基于此进行一体化的实现,填补了该方面研究的匮乏。实验证明本文的模型能科学有效地承担隐喻计算的任务,为今后隐喻相关研究提供了新思路。
其他文献
天然气水合物作为新型非常规清洁能源而备受关注,全球97%以上天然气水合物藏发现于大陆边缘海底沉积物中。当天然气水合物藏温压条件改变,天然气水合物将发生分解,释放向上渗漏的甲烷流体。甲烷向浅层运移过程与沉积物孔隙水中硫酸盐发生的甲烷厌氧氧化(SR-AOM)作用,最终与孔隙流体中金属离子反应形成碳酸盐和硫化物等相关自生矿物,并对自生矿物形态及结构产生影响。渗出海底的甲烷流体,经氧化将形成不同产状和矿物
目的:临床同种异体移植的成功是以终生服用药物来源的免疫抑制剂为代价的,长期使用免疫抑制剂具有较多副作用。既往的研究表明间充质干细胞(Mesenchymal stem cells,MSC)具有免疫调节功能,在器官移植中可以调节炎症的进程并改善移植物的状态,现有研究证明,MSC在体内外均有免疫调节的作用,且可以延长移植物的存活时间。此外,在临床移植中,MSC已被多次应用并证明其安全性。在本研究中,拟通
T细胞白血病1(T-cell leukemia/lymphoma 1,Tcl1)在白血病中作为原癌基因,已有文献报道Tcl1在肝癌中与戊糖磷酸途径有关。然而,Tcl1是否在结直肠癌(Colorectal cancer,CRC)的发生发展中发挥作用尚无明确报道。因此,我们研究了 Tcl1在CRC中的作用。利用蛋白质免疫印迹(Western Blot,WB)和逆转录-聚合酶链反应(RT-PCR)验证T
当前全球数字化社会建设日益成熟,云服务日渐得到个人、组织机构和大型企业的青睐,可预见未来所有的组织机构都将使用云服务。与此同时,文件共享和文件协作是近六年来使用率最高的云服务类别,这对云服务中文件共享和文件协作、以及文件同步技术提出了更严峻的挑战。针对云同步技术收到的挑战,如何提升云同步性能,为庞大的用户群体提供优质的服务是亟需解决的问题。首先,分析现有云同步技术在大规模应用云服务场景下的同步效率
21世纪进入了信息化的时代,信息化已经进入各行各业,并且信息化技术变成了当今世界上发展最迅速的产业,与此同时,人们对信息化的要求越来越高,对信息化的需求的变化日新月异。我们如何能快速完成项目的上线,如何能快速响应需求的变更一直是各个技术团队希望解决的问题。要解决这个问题,需要拥有一个高效快速的二次开发系统,能让系统更快的投入生产,更能拥抱需求的变更。而一个高效快速的二次开发系统首先系统架构上要整体
随着互联网的高速发展,越来越多的网民在社交平台发表言论,促进了世界的多元化交流。但问题也随之而来,大量的谣言也在社交平台上传播,一些涉及公共安全的谣言,更是对社会稳定造成巨大伤害。然而目前的谣言检测侧重于文本特征、用户信息以及传播结构信息,它们本质上仍然是通过分析用户的发布意图来检测文本的虚假性,却忽略了知识的重要性,在目前谣言数据集数据量少、收集困难的情况下更是影响到谣言检测的性能,因此外部知识
核电站的兴起缓解了当今的日益增长的能源供需矛盾。然而,2011年发生于日本福岛核电站的重大核事故再次使人们将目光集中在核安全的问题上,该事故暴露了燃料颗粒包壳锆合金在高温水蒸气下易发生锆水反应释氢的安全问题。基于该背景下,一种被称为“事故容错燃料”(Accident-tolerant fuel,ATF)的技术概念得以提出。在该技术概念中表面覆膜技术因其成熟的工艺和应用而受到青睐,其中非晶/晶体纳米
人们的日常生活和软件应用服务越来越无法分离。为了应对不断变化的需求,软件开发团队能够快速的对产品进行迭代变得越来越重要。随着微服务、DevOps、容器技术的逐步发展,云原生应运而生,为软件应用服务的快速迭代提供了解决思路。目前谷歌开源了 Kubernetes为容器的管理提供了帮助,但主要是作为容器的编排工具,不能够完全涵盖云原生应用从源代码到发布的整个流程。本文基于Kubernetes实现了一个云
甲骨文,是中国最古老的象形文字,在漫长的汉字发展史上起着举足轻重的重要地位。但要识别未释读的字或者收集、分类相关实例内容是需要花费很多的时间和精力。而利用图像检索技术可以在海量的图像大数据中以较小的时空开销准确地找到一幅相似的图像,图像检索也成为近年来多媒体和信息检索领域的重要研究热点。因此,如何利用图像检索技术对甲骨文图像进行分类与识别的研究也具有非常重要的意义。图像检索的本质是通过对图像进行特
多标签图像分类是图像分类领域的一个重要研究课题,是对单标签图像分类任务的拓展。相对于单标签图像分类任务,多标签图像分类具有更大的复杂性,并且由于标签之间存在一定的相关性,所以探索标签之间的相关性来辅助多标签分类是一个十分有意义的课题。本文以多标签图像分类为目标,重点探索模型各部分蕴含的标签相关性对模型性能的影响。主要基于ResNet骨干网络进行改进,并在基准数据集(MS-COCO和NUS-WIDE