基于意象图式理论的中韩动词语义标注方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:zjj1993930
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究旨在提出一种基于意象图式理论的、可跨语言的动词语义标注方法,以更精确地对不同语言(此论文中以中韩为例)中的动词进行范畴划分,完善当前的语义标注系统,由此来提高计算机在机器翻译等在跨语言的自然语言处理任务中的动词匹配精度。本研究共分为五部分:第一部分为研究背景与意义的论述。通过文献综述,我们发现当前语义标注研究,一方面对动词分类的研究较少,且缺乏系统的分类标准;另一方面大部分研究仅针对单一语种,无法对双语乃至多语文本进行统一标准下的处理。由此导致机器翻译系统在处理动词时,准确度较低。本研究试图提出一种新的动词语义标注方法,进而提高机器翻译的动词翻译质量。第二部分为意象图式理论的详尽介绍。我们对意象图式定义和一般特征进行介绍的同时,重点论述了意象图式的种类及其“作为比较分类实体”的功能,以此作为本研究所提出的动词语义标注方法的主要理论依据。第三部分为语料标注实验的展开。我们根据意象图式理论建立了用于本研究动词语义标注的标签集,并以中韩平行语料为实验对象,按照一定的标注原则对中韩语料进行了标注试验。第四部分为实验标注结果的实例分析。通过列举标注实例,我们分析了所提出的基于意象图式理论的动词语义标注方法在标注实验中的表现。整体上,本研究所提出的标签集中的各意象图式标签在实验语料中均有涉及,且有大量动词涉及到两种或以上的意象图式标签,即复合图式。其次,面对中韩语料中出现的概念隐喻、转喻等现象,我们从认知层面入手,为大部分平行语料匹配到合适且一致的标签。最后,我们分析了因主客体不一致引起的意象图式标签不一致,以及多义词在本次标注实验中的处理情况。第五部分为实验标注结果的统计分析。通过横向和纵向对比分析各意象图式标签在中韩语料中触发频次的统计数据,我们发现与是否去重无关,各意象图式标签的触发频率存在明显不同,且频率的高低与目标语言的种类无明显的相关性,同时中文和韩文使用者在将大部分意象图式转化为语言表述的模式上无明显差别。最终,我们认为本研究所提出的基于意象图式理论的动词语义标注方法可以较好地应用于中文和韩文的平行语料,即可实现对不同语言的动词进行统一标准下的语义范畴划分。这说明此种标注方法在提高机器翻译的中韩动词匹配精度方面具有一定的研究价值和应用前景。
其他文献
转录阻遏蛋白Rex在包括枯草芽孢杆菌(Bacillus subtilis)、金黄色葡萄球菌(Staphylococcus aureus)、肺炎链球菌(Streptococcus pneumoniae)、天蓝色链霉菌(Streptomyces coelicolor)等多种革兰氏阳性细菌内保守存在,通过感知细胞内NAD+/NADH比例反映氧化还原状态,维持细胞内氧化还原平衡。一定条件下,Rex蛋白特异
在未来网络技术背景下,以软件定义网络(Software Defined Network,SDN)为代表的新型网络技术打破传统网络平面整合结构,将控制与转发功能分离,其可编程控制与集中管理特点为网络规模的扩展提供了优秀的解决方案,目前已在数据中心网络、骨干网与广域网等场景得到了应用。但SDN网络在实际应用中仍面临一些安全性问题,当网络被攻击时,快速精准地检测入侵行为对保障网络安全运行具有重要意义。为
欧李(Cerasus humilis(Bge.)Sok.)为蔷薇科(Rosaceae)樱桃属(Ceraras)经济林木,是中国特有的多年生物种。欧李原产于偏远的北部山区,荒野和其他一些人口稀少的地区,对干旱,寒
近年来,深度学习的兴起使得人们日常生活中接触到许多与人工智能相关的技术和产品。国家对人民的安全问题也愈加重视,安防产业也因为深度学习、计算机视觉等领域的落地得到了长足的发展。行人重识别是安防产业、视频监控其中一个重要的研究方向,它在智慧城市领域有着举足轻重的作用。随着深度神经网络的快速发展和智能视频监控需求的不断增长,行人重识别成为工业界和学术界共同关注的课题,它的首要任务是从大量监控视频中准确识
病毒性传染病严重威胁着人类的健康,随着世界经济的快速发展和全球化步伐的加快,新发、突发病毒性传染病接踵而至并蔓延流行。由于新发病毒性传染病发现时间短,许多安全且有效的疫苗和药物仍处于研发阶段,小分子药物对治疗病毒性传染病存在巨大潜力,可利用天然或合成化合物筛选抗病毒活性物质,以期找到特异性高、毒性小的抗病毒药物,解决传染病病原体感染机制不明情况下药物研发的盲目性。本研究依托中检院拥有的中药化学提取
药品是人类生活中不可或缺的物品,对维护人们身体健康具有重要作用。近年来,我国医药费用过快增长问题日益突出,最明显的是药品价格上涨速度远远高于一般商品,药品价格问题成为广大社会媒体的焦点,更加受到人们的关注。虽然我国政府长期以来一直致力于对药品价格的管制,在一定时期内对药品价格的控制发挥了积极的作用,但随着医药市场环境的变化,并没有有效解决药品价格不合理的问题,反而造成政府对药品价格管制失灵。目前,
广告市场有很多独到的创意和广告媒体,为商品和服务的推广开辟了新的机会。如今,广告市场更需要新的解决方案和与目标受众互动的有效方式。广告适应我们的生活方式和环境,有时会以意想不到的方式围绕着我们。环境媒体是广告界最热门和热门讨论的话题之一。非传统的接近向消费者传递广告信息一直非常有吸引力。现在有许多方式来放置户外广告,但其有效性首先取决于创造力。本文重点介绍环境广告方法的重要性和作用。环境媒体的“特
随着信息时代的到来、计算机技术的不断发展以及人工智能的兴起,信息化、数字化、智能化成为了社会发展的趋势。目前,在考试领域,考生考卷大多以纸质或图像的形式进行存储,为了方便对这些考卷进行分析、保存,需要将这些纸质或者图片上的数据转录成文本数据,进而实现对考生试卷的信息化与智能化处理。面向试卷的手写英文识别就是对试卷信息化与智能化处理的一种关键技术,本文从试卷图像的单词分割、单词识别以及单词识别后处理
倡导全民阅读构建书香社会,关键节点在城市。城市阅读推广工作是一项需要多个主体共同推进的复杂性工程,其参与主体涉及公共图书馆、政府部门、出版发行行业以及其他民间社会力量等多方。此外,省会城市与同省其他城市相比无论是经济、文化发展水平,还是拥有的出版社、书店以及其它社会力量的数量都占有很大的优势。有利的社会环境促使阅读推广工作开展的比较早,目前各机构间也积极的尝试和探索了一些合作发展的途径,合作发展初
伴随着智慧城市以及公共安防领域的飞速发展,视频监控系统的应用范围不断扩大,面对每天都产生的大量监控视频数据,传统的视频分析技术已经无法满足人们实际的需求,怎样才能快速地从视频数据中获取所感兴趣的目标逐渐成为一个研究的重点。与此同时,由于深度学习框架在目标检测与识别任务中的突出表现,很多学者不断尝试将其框架应用于智能视频监控技术研究之中,训练更具泛化能力的模型来解决实际监控中的问题。基于以上的背景,