科技文本被动句机器翻译效度实验报告

来源 :烟台大学 | 被引量 : 0次 | 上传用户:lovegoodone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着神经网络技术的发展,机器翻译迎来了新发展浪潮。在对国内语言服务行业进行的调查中,我们可以看到,机器翻译在语言服务行业的应用越来越广泛。而所涉及的翻译服务领域中,科技类文本占比最大。研究表明,机器翻译在翻译文学类文本时具有一定的适用性。但由于受到其机械性和自动性等特征的制约,机器翻译更适用于科技文本等非文学文本的翻译。在英语科技文本中,被动句是最为常见的一类句式,在运用机器翻译处理科技文本时,被动句机器翻译效度的高低在一定程度上影响了整篇文本的翻译质量。本研究选择基于神经网络技术的百度、谷歌、有道三个在线机器翻译平台作为研究对象,从高校英语专业教材中选取科技文本被动句例句共220句作为研究语料,对机器译文进行对比分析,探讨科技文本被动句的机器翻译效度。在进行BLEU评分时,首先依据人工译文所采取的翻译方法对所得译文进行分类,再利用Corpus Word Parser将译文进行分词处理以便计算BLEU值。在统计语言计量特征时,采用Corpus Word Parser和Free CLAWS web tagger对文本进行词性标注,在Antconc里对处理后的文本进行检索统计。统计译文句型时,先将人工译文的句式特征进行分类,作为参考标准来划分三个机器翻译的译文。进行分析时,结合上述数据和实验所得译文,以科技英语翻译标准为基准,将机器翻译的译文、人工译文和英语原文进行对比。通过定量和定性分析相结合的方式,探讨机器翻译科技英语被动句的效度。研究发现,三个机器翻译在本次实验中具有一些共同点。从整体上看,实验所选的三个在线机器翻译平台在翻译时更倾向于将英语被动句处理为汉语主动句,这一点与译者所做的处理类似。机器翻译更倾向于逐字对应翻译,更拘泥于源语形式。另外,通过对比四个译文中的汉语被动句特征,可以看出,机器译文中“被”字的使用率远高于人工译文,机器很少采用其他被动标记词来表示被动语态。这说明机器在处理英语被动句时不够灵活,译文中的句式较为单一。通过结合实验数据和所得译文的综合分析来看,三个机器翻译也各具特征。这三者之中,有道译文与人工译文相似度最高,术语翻译也最为准确,译文也更贴合汉语读者的表达习惯。但其虚词显化现象也最为突出,这说明有道译文较其他两者稍显繁琐。谷歌译文在三者中最为简洁,可以用较短语句来传达信息,但其信息准确性却不如有道,这是由于其术语翻译不如有道规范。另外,谷歌译文在句子结构上更贴近源语,这说明谷歌译文更倾向于按照原文语序逐字对应翻译。百度翻译在本次实验中的表现中规中矩,但存在漏译问题,导致百度译文在完整性评估上不如其他两者。在本次实验中,综合来看,机器翻译效度均不如人工译文高。但有道表现最好,在翻译科技英语被动句上具有较好的翻译效度。本项实验研究不仅丰富了对科技文本被动句的研究,对机器翻译的后续研究提出期望,同时也对人工译后编审提供了一定启发。
其他文献
图像是一种重要的信息载体,相比于无颜色的草图,彩色图像具有更丰富的视觉信息。然而,手动对图像进行着色是一个耗时耗力的过程,因此自动着色问题具有很高的研究和应用价值。近年来,许多研究人员将深度学习技术应用到了自动着色问题中,并已经实现了一些低成本、简单、快速的自动着色模型。然而,模型通常缺乏对草图中语义信息的理解,无法准确地识别出草图中的不同区域,导致自动着色的结果中容易出现颜色渗透、着色错误等问题
学位
自二十世纪八十年代起,隐喻习得研究逐渐受到应用语言学界的持续关注,以认知语言学理论和方法为指导的隐喻习得研究成为热点话题。研究学习者的二语隐喻能力并探究其主要影响因素对于提升隐喻习得效果与培养学习者隐喻能力有重要意义。其中,隐喻识别能力是隐喻能力的重要组成部分,是判定学习者隐喻习得成功与否的基础。学习者识别隐喻的效果可能受自身认知风格、二语水平以及隐喻难度等多因素影响。就认知风格与语言水平的影响作
学位
在纯数学以及数学与其他学科中的交叉学科中都涉及到了很多非线性椭圆型方程,这种方程的研究受到了广泛关注,其研究无论在理论上还是实际应用中都有着重要意义.本文主要目的是求出非线性椭圆型方程问题的多个解.就我们所知,目前关于关于椭圆型方程多解问题的研究都是利用传统的数值算法,并且大多数工作是关于二维微分方程的.关于微分方程的深度学习方法的研究越来越多,具有处理高维微分方程的潜力.非线性椭圆型方程多解问题
学位
鲁迅先生的短篇小说集《呐喊》标志着中国现代新文学的开始与发展,其中文化负载词所蕴含的文化内涵吸引了国内外研究者的关注,也引发了不少译者的广泛兴趣。其中,尤以我国译者杨宪益、戴乃迭译本和美国译者莱尔译本为代表。译者的主体性体现在翻译的每个环节,从文本的选择和解读,翻译策略的运用,到原文文化内涵的再现,无不蕴含了译者个人丰富的思考和智慧。本研究拟通过观察不同译本中文化负载词的翻译,探讨译者在重现文化内
学位
在土壤科学、地下水水文学和环境工程等学科中,预测非饱和土壤中的流体运动是一项重要问题。尤其是在暴雨袭击时,了解水渗入土壤的方式对预测洪水和滑坡等灾害至关重要。由于Richards方程在灾害预测等方面有重要应用,快速且稳定的计算方程成为许多学科需要解决的重要问题之一。本文针对Richards方程做了数值计算方面的研究工作。在第二章中,我们建立了求解h-型Richards方程的半隐式线性化有限元方法。
学位
本翻译实践节选了史蒂夫·门兹的书Ocean进行翻译。Ocean是一本散文集,描述了西方文化视角下的海洋,用词优美、富有诗意。作者在书中表达了他的审美感受与对海洋文明的思考,充满了丰富的情感。根据文本内容和特点,本报告选择了切斯特曼翻译规范理论作为理论框架。本论文旨在研究译者在进行翻译活动时会受到哪些翻译规范的影响,并分析在这些翻译规范的影响和制约下,译者在进行散文翻译时会采取何种翻译策略。译者选取
学位
曲线和曲面拟合在科学和工程等领域里一直都是重要的研究课题.样条函数因其灵活性等优点,已经成为曲线曲面拟合中必不可少的工具.近些年来,随着研究的逐步深入,利用简单的样条来描述复杂的实际问题已经不再适用了,进一步研究更加灵活、高效的样条函数以及曲线曲面拟合方法就变得十分必要.本文主要研究和讨论如何利用样条函数来自适应地对曲线曲面进行拟合.一般来说,曲线曲面拟合问题都会涉及到解线性方程组的问题.但是随着
学位
巴金的作品以描写家庭生活为主,小说《家》通过对高公馆由盛转衰的描写,展现了封建专制制度必然崩溃的历史趋势,讴歌了青年们的觉醒和反抗。“把”字结构是汉语中的典型表达,其句法结构为“N1+把+N2+VP”(VP是动词短语)。“把”字使得宾语移位至动词前,动词后可附加更多成分。该类结构不仅广泛应用于书面语,在口语中也大量使用,对于小说和戏剧的人物刻画和心理表征具有重要的辅助作用。本文以巴金小说《家》及曹
学位
《文化中国》一书是中国现代新儒学代表人物杜维明先生缅怀其在东海大学的业师牟宗三和徐复观所著,系儒学主题著作,共收录杜维明先生有关新儒学的文章18篇。本文选取第三篇作为翻译材料,因其集中体现了作者的新儒学思想,具有深刻的中国文化思想内涵。根据纽马克的文本类型学,并通过对翻译材料进行分析,笔者判定原语文本既是表达型文本,又是信息型文本,兼具独特的原文风格与向读者传递信息这两种特征。鉴于此,为使译文保留
学位
顺序回归,又称为排名学习,是机器学习领域中的一种介于分类和回归之间的监督学习问题.顺序回归的目标是从带有排序标记的样本中学习一个多分类器来预测新样本的标签.许多现实问题都非常重视对标签之间顺序关系的处理,这些问题大多可以被建模成顺序回归问题.事实上,在那些重视人类需求、行为与偏好的领域,顺序回归已经得到了广泛的应用,比如医学研究、信用评级、文本分类、人脸识别、社会科学等.支持向量机(Support
学位