【摘 要】
:
随着互联网技术的发展,不同文化间的交流呈现迅速上升的趋势。作为自然语言处理领域最具挑战性课题之一的机器翻译受到越来越多的研究机构的重视。本文在东北大学与日本富士
论文部分内容阅读
随着互联网技术的发展,不同文化间的交流呈现迅速上升的趋势。作为自然语言处理领域最具挑战性课题之一的机器翻译受到越来越多的研究机构的重视。本文在东北大学与日本富士施乐公司多年研究基础上,探讨了基于模板的汉日机器翻译方法(PBMT),并实现了面向真实文本的汉日机器翻译系统。模板匹配和短语翻译是影响基于模板机器翻译性能的关键因素。本文通过基于文本-模板直接匹配、模板选优等方法改良了基于模板的机器翻译翻译方法,改善了机器翻译系统的性能。本文的主要内容包括:(1)本文通过面向机器翻译的文本-模板直接匹配改良了传统的PBMT在模板抽取方面的不足。该方法解决了由于目前句法分析器的性能还难以满足实际需要,使得模板抽出效果不理想,进而影响PBMT的翻译效果的问题。翻译模型根据候选模板对待翻译句子直接进行形式变换,之后计算二者之间的编辑距离,最后用回溯算法获取二者间的映射关系。(2)本文通过模板选优模型改良了小模板误匹配和同一个翻译句子存在多个候选匹配模板等问题。模板选优模块是通过分析变换后的句子与源语模板之间的编辑距离、模板中短语译文翻译质量以及候选模板覆盖度三个因素来进行最优模板选择。(3)模板翻译中短语的翻译质量直接影响最终译文的质量。本文通过构建独立的短语翻译引擎,并将基于文本-模板直接匹配的翻译引擎作为短语翻译引擎的一个子引擎,在定程度上解决了模板嵌套的问题,提高短语翻译质量。实验结果表明上述方法在汉日机器翻译上取得了令人满意的性能,翻译系统应用效果良好。
其他文献
世界范围内,因为汽车数量快速增长加剧了交通事故的发生频率,引起人们对车辆安全的高度关注,而针对汽车辅助驾驶系统的研究越来越受到国内外的重视,由于道路环境下运动车辆的
博客是伴随Web2.0出现的一个典型应用,随着博主越来越多,博客页面的数量迅速增长。由于每个用户自身情况千差万别,面对Internet上指数增长的可用信息,人们越来越难找到自己想
随着多媒体技术和网络技术的迅速发展,视频作为一种主要的媒体类型已成为与人类工作生活密不可分的信息载体。庞大的视频数量和不断彭胀的用户群体急需要一种高效的组织视频
随着互联网的发展,商品的种类越来越多,商品的信息结构也越来越复杂,影响推荐系统性能的附加信息也随之增长。附加信息是指除评分矩阵以外的文本、属性、地理位置、时间等信
随着互联网信息的不断增长,博文成为Web2.0的重要应用,人们使用博文进行发表观点,书写生活等一系列活动。由于网络中蕴含着大量的信息,用户对博文搜索引擎的功能、搜索效果以
随着信息化发展速度的不断加快,XML技术发挥的作用越来越重要。目前,XML在多领域的数据表示、建模分析等方面都有广泛的应用。然而建立在多维度基础上的XML数据查询却比较复
随着社会的进步和科学的发展,信息数据量呈爆炸性增长,特别是基因序列这样的数据,其增长速度已经超出了人们的想象,给数据存储和传输造成了很大的压力,各种压缩技术被提出来
随着网络的发展,网络安全问题也日益突出。网络蠕虫肆虐,正给网络用户造成了巨大的损失。而蠕虫传播模型的研究对于揭示蠕虫的传播特性和规律,并提出行之有效的控制方法,有重
随着科学技术的迅猛发展,视觉系统以其信息量大等优点成为了一种重要的导航方式,在机器人视觉、视频监控、导航、飞行器等方面已经得到了广泛的研究和应用。目前,利用机载摄
近年来,随着无线互联网技术和移动通信技术的发展,用户对于移动性通信的需求越来越高。目前全球范围内存在着多种无线接入网络,用户可以随时随地接入合适的无线网络中进行通