跨语言命名实体翻译对抽取的研究综述

来源 :计算机科学 | 被引量 : 0次 | 上传用户:huai0407
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨语言命名实体对于机器翻译、跨语言信息抽取都具有重要意义,从命名实体的音译、基于平行/可比语料库的跨语言命名实体对齐、基于网络挖掘的跨语言命名实体对翻译抽取3个方面对跨语言命名实体翻译对抽取的研究现状进行了总结。音译是跨语言命名实体翻译对抽取的重点内容之一,基于深度学习的音译模型将是今后的研究重点。目前,跨语言平行/可比语料库的获取和标注直接影响基于语料库的跨语言命名实体对齐的深入研究。基于信息检索和维基百科的跨语言命名实体翻译对抽取研究将是跨语言命名实体翻译对抽取研究的趋势。
其他文献
首先定义了不完备决策形式背景,在其不完备的子条件形式背景和子决策形式背景上,提出了双子集内涵概念的构建方法及概念格的生成算法,给出了不完备决策形式背景基于双子集内
相对于柯氏音法,通过脉搏传播时间估算血压不仅更为便携,还可以实现血压的连续测量。但是因为现有研究建立的线性方程的有效时间较短,所以脉搏传播时间随血压变化的机制有待
高能物理是典型的数据密集型计算环境,数据处理包括模拟计算、重建计算以及物理分析。其中大文件计算占据较大比重,并且高能物理文件访问模式以跳读为主,因此大文件的高速访
Halo-based Galaxy Group Finder(HGGF)是一种有效的星系分组算法,它根据星系的空间位置、红移、质量等多种属性将星系分组,从而为星系组的形成与演化研究提供重要依据。但是,
灰狼优化(Grey Wolf Optimization,GWO)算法是近年被提出的一种新型智能优化算法,具有收敛速度快和优化精度高的特点,但对于一些复杂优化问题易陷入局部最优。差分进化(Diffe
针对概念分解算法没有同时考虑数据空间和特征属性空间中的高阶几何结构信息的问题,提出了一种基于对偶超图正则化的概念分解算法。该算法通过分别在数据空间和特征属性空间中构建无向加权的拉普拉斯超图正则项,分别反映了数据流形和特征流形的多元几何结构信息,弥补了传统图模型只能表达数据间成对关系的缺陷。采用交替迭代的方法求解算法的目标函数并证明了算法的收敛性。在3个真实数据库(TDT2、PIE、COIL20)上
知识约简可以保持决策系统中的分类特征不变,是粗糙集理论的重要研究内容之一。分布约简保持约简前后决策系统中各规则的置信度不发生改变。为了给区间值决策系统的论域分类
数据挖掘在多尺度研究方面取得了一些成果。然而,多尺度数据挖掘研究还不够深入和完善。目前针对空间和图像数据的研究较多,对于一般数据的多尺度数据挖掘的研究较少。随着大
分析了Altera公司嵌入式Nios微处理器的基本特点,介绍了基于Altera Nios平台的鱼雷电源组件自动检测系统的设计与实现,详细地讨论了片上系统各个组成部分的工作原理,作为一个
针对CRH2型动车组列车网络流量数据日益复杂的特性,提出了一种将主成分分析法(PCA)与后馈神经网络(BP网络)相结合的网络流量建模预测思路。基于已搭建好的CRH2型列车通信仿真平台