维吾尔语不同词尾粒度对维汉词对齐的影响

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:harryamarly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔语中,词的复杂形态是导致数据稀疏问题的主要原因,为降低数据稀疏对词对齐和机器翻译的不良影响,尽可能挖掘词尾携带的语义信息,提出对词尾采取“分离一丢弃”方案。根据统计分析,对维吾尔语词进行词干、词尾分离后,对其语义信息被明文翻译概率高的词尾采取“分离”方案,概率低的词尾采取“丢弃”方案。将该方案应用到维吾尔语名词和动词上,分等级构造9种模板进行实验,实验结果表明,该方案抑制了词千、词尾分离带来的句子长度过长问题,增加了维汉词对的数量,提高了维汉机器翻译质量,验证了该方案的有效性。
其他文献
长期以来文化障碍一直被认为是制约大学英语教学的消极因素,而中国文化中适合于外语学习的许多优秀传统被忽视。本文主要讨论中国传统学习文化中有益的部分,探讨其对大学英语教
提出了一种新型三角形簇作为GPU的图元绘制单元,结合LOD技术实现了自适应的无裂缝地形渲染。该三角形簇,称为N-簇,分为8种基本类型,不同尺寸和位置的地形网格块都可以通过这8种基本类型进行缩放和平移得到。采用二叉树数据结构组织N-簇,每个二叉树节点对应一种N-簇,同时存储了N-簇的缩放及平移。结合八边形误差算法进行场景LOD的构建,避免了不同LOD层次间过滤产生的T-连接。由于大规模地形的高程数据
由于人们之间的博弈行为受多种因素的制约和影响,而传统的博弈方法很难处理这种影响因素多变、交互关系复杂的博弈问题,给出一个基于博弈学习的多智能体(multi-Agent)交互模型,
为解决企业信息异构和数据整合问题,结合SOA和ESB技术,提出了一种轻量级SOA-ESB企业整合架构。对ESB总线层的适配转换、路由以及安全问题进行了研究,通过协议分析映射、XSLT
俄语的语法规则复杂,尤其是名词格的用法更是意义繁多,十分灵活,不易把握。这里针对俄语名词格的限定意义将之与英语相应表达作一比较。希望能对学习俄语的英语专业学生有所帮助
滑模控制响应快,对系统参数和外部扰动呈不变性,可保证系统的渐进稳定性,但其缺点是控制存在很强的抖动。在一般滑模控制的基础上引入径向基函数神经网络(RBFNN),利用滑模控制的特
为提高网络应用系统的安全性,同时降低系统升级的成本和复杂性,提出了一个基于公钥基础设施(PKI)和U盘的身份认证系统。在系统设计中,以PKI安全体系为基本框架,采用“挑战/应答”协
对由型值点定义的NURBS曲面进行反求计算,采用等参数法离散NURBS曲面得到NURBS曲线组,并以MATLAB语言为算法核心、以VB6.0为平台,开发了曲面造型及逼近系统,最后通过实例验证了该
在飞机上采用的高精度液压伺服系统中,针对高精度滤芯纳污容量小、易堵塞、压力损失大、维护工作量大、过滤时间长和无法滤除油液中水分的问题,开发出一种高速离心油液过滤设备
通过对本体知识推理原理的探讨,针对构成本体知识库的本体知识模型与知识规则,完成了土地适宜性评价任务本体与评价知识规则的构建。作为研究重点,以基于AHP的评价因子权重评