名词性短语的英汉机器互译研究

被引量 : 0次 | 上传用户:shunbe123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译是计算机技术、语言学、自动化技术、数学等多学科结合的产物。当今的计算机软硬件平台足以支撑大数据存储和高速运算,但机器译文的质量仍然不能令人满意,误译现象经常出现。在英语和汉语中,名词性短语出现的频率较高,搭配与结构比较复杂,因此本文以名词性短语为研究对象,以人工译文和机器译文为对比平台,对机器译文进行详细的分析,找出误译的原因,并提出可供参考的解决方案。本文将已有人工译文的语言片段作为语料,使用通用领域中较权威的两种机器翻译软件作为工具,把语料放入软件中进行翻译,将处理后的机器译文与人工译文作比较,对所产生的误译现象作分析。经分析发现,在英译汉的机器翻译过程中,机器对名词性短语中多义词和介词的语义判断不够准确,会影响整个短语乃至句子的意思。而在汉译英的机器翻译中,除对多义词词义的判断不够准确外,同形异义结构的短语也会让机器难以判断其语义。针对这些问题,本文对数据库中的语料进行语言学特征标记,并在MT软件中运用CAT技术,对翻译后的译文进行存储处理,使其具有采用记忆功能。为了保证机器不被日益增加的数据拖慢运行的速度,机器定期检查数据,对优先调用的数据进行优化处理,并且在存储语料的数据库容量接近限值时,清理不经常访问的数据,以保证其一直有足量的存储空间来容纳新的译文,从而更好地处理语言转换的工作。英语和汉语名词性短语的人机翻译研究,对名词性短语机器误译进行分析并给出解决办法,如建立具有语言学特征数据库等方案,将为研究机器翻译在其他短语、句子、篇章等层面的问题提供合理的参考和借鉴。
其他文献
目的:本临床研究为进一步探讨补肾活血方对不明原因复发性流产(unexplain recurrent spontaneous abortion,URSA)的调节机制及临床疗效,选取白细胞介素 13(interleukin-13,IL
含气量是进行煤层气资源计算与选区评价的关键。在有效含气量数据太少,不能满足研究工作需要的情况下,根据少量实测含气量数据和煤的等温吸附曲线、储层压力梯度、煤的水分、灰
中华绒螯蟹,通常称河蟹。其肉味鲜美,营养丰富,适应性强,养殖成本低,经济价值高。为了增殖我省水产资源,扩大养殖品种,充分利用滇池的饵料基础,我们于1980年6月进行了河蟹大
目的:观察加味少腹逐瘀汤联合经痛消方治疗原发性痛经寒凝血瘀型临床效果。方法:选取寒凝血瘀型原发性痛经患者90例,随机分为对照组和观察组各45例。对照组予以经痛消方治疗,
促肾上腺皮质激素释放因子(corticotropin-releasing factor, CRF)家族肽包括4个成员,即CRF, Urocortin (Ucn), Urocortin2 (Ucn2)和Urocortin3 (Ucn3)。 CRF家族肽广泛地分
人际关系是影响高校学生心理健康状况的重要因素,随着时代的变化,当代大学生群体在人际关系方面呈现出新的特点和规律。本文在问卷调查及访谈的基础上,深入探讨大学生人际关
协方差阵在投资组合和风险管理中扮演着重要角色,但是大维数据给传统的协方差阵估计方法带来了巨大挑战.本文将改进的乔列斯基分解和惩罚函数等非参数方法应用到DCC模型的估
一氧化碳(Carbon monoxide,简称CO),在通常状况下,CO是一种无色无臭无味的有毒气体。它具有可燃性,是常用的气体燃料,是由含碳物质燃烧不完全所产生,生活中常用的煤炭,液化灶
对于跨国公司来说,由于其在海外附属企业或项目的生产经营活动会不断得到母公司或集团内其他成员企业的技术服务、经营许可、管理服务及内部贷款等,因此发生的费用理应由收益
鲁迅对于晚清四大谴责小说的定义和评价已成为文学史上具有重要影响的学术观点.但对于鲁迅何以构建“谴责小说”及与之紧密相关的“讽刺小说”概念的过程及理论基础,学界尚未