低资源语言相关论文
自动语音识别技术发展至今日,无论是在传统混合语音识别架构还是新兴的端到端识别架构上,在声学语料充足、资源丰富的语言上,均已......
针对传统跨语言词嵌入方法在汉越等差异较大的低资源语言上对齐效果不佳的问题,提出一种融合词簇对齐约束的汉越跨语言词嵌入方法。......
随着互联网的快速发展,学生抄袭网络资源的现象屡见不鲜。在高等教育领域,已有一些针对学生论文剽窃检测的研究,但在藏文等低资源......
平行句对抽取是解决低资源神经机器翻译平行语料不足的有效途径。基于孪生神经网络的平行句对抽取方法的核心是通过跨语言语义相似......
21世纪海上丝绸之路沿线区域分布着数量众多的非通用语言。这些非通用语言的资源稀缺性严重影响了自然语言处理的性能。针对低资源......
机器翻译,研究如何利用计算机自动地实现不同语言之间的相互转化,是自然语言处理的重要研究方向之一。近年来,随着深度神经网络技......
通过对菲律宾语的词法分析、句法分析、语义分析等基础研究和机器翻译、拼写检查、情感分析等应用技术的研究进展进行分析,得知菲......
低资源场景下神经机器翻译模型的翻译效果通常不如大规模训练数据下的模型翻译效果好。针对这个问题,选取RNN-based和Transformer-......
随着印尼语、马来语互联网普及率的上升,对海量印尼语、马来语文本进行信息处理存在重大需求.虽然研究人员对印尼语、马来语展开较......
该文针对藏文语料稀缺的问题,在藏汉双语、藏文单语文本改写检测任务中使用数据增强的方法,在一定程度上解决了低资源语言训练语料......