基于依存树到串模型的日汉统计机器翻译研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:muyue3122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译是自然语言处理研究领域的一个重点和难点问题,具有重要的研究价值和商业应用前景。近年来,统计机器翻译技术发展迅速,如何在统计翻译模型中融合更多的句法结构和语义信息,实现真正意义上基于语义的统计机器翻译,是研究人员共同努力的方向,也是研究的热点。本文以格语法和日语依存树为切入点,以日汉统计机器翻译为主要研究方向,重点研究并提出了一种基于语义的日汉统计机器翻译模型。本文的主要研究成果包括:(1)基于格语法和日语依存结构定义了一种日语格框架文法。并且,基于该文法提出了适用于统计机器翻译中依存树到串模型的格框架调序规则,使得格语法信息能有效地融合到依存树到串翻译模型中。(2)提出一种新的依存树到串统计机器模型。该模型定义了一种新的格框架调序规则。该调序规则与词汇化短语翻译规则融合应用于该依存树到串模型中,其实用性在基于大规模训练语料的实验下得到了有效验证。(3)提出了适用于日汉翻译的依存树到串模型的解码算法。采用了自底向上的图解码算法,并加入了短语优化本文方法。本文方法成功地将语言学知识融合到统计机器翻译的依存树到串模型中。日汉方向的实验结果表明,本文提出的方法可有效改善日汉统计机器翻译的句法结构调序和词汇翻译,并提升统计机器翻译译文质量。日英方向的实验结果表明,本文方法在以日语为源端的其他语言同样有效。
其他文献
随着计算机网络和通信技术的飞速发展,包括数字图像在内的数字媒体得到了广泛的应用,但随之而来出现了一系列数字媒体的信息安全问题。一方面网页上处处可见图像,复制、编辑
随着网络速度的不断提高,规模的扩大,以及应用需求的多样化,网络上的数据流变得复杂而多变。这都给网络管理和维护以及网络安全提出了更新、更高的要求。网络管理软件、防火墙软
计算机基础课程教学是为非计算机专业学生提供有关计算机基础知识、操作应用能力的教育,旨在使学生掌握计算机基本操作技能,其课程的特点是操作性强。无论是平时的实验实训,还是
互联网的飞速发展极大地方便了人们从网络上获取多媒体数据,同时也给版权保护这一问题提出了新的挑战。数字水印技术作为一种新的有效数字产品版权保护的技术手段,是目前国际
目前,对等网络(Peer-to-Peer,P2P)技术正在吸引越来越多的眼球,其中包括来自工业界以及学术界。而在基于P2P覆盖网络的应用系统中,负载平衡是非常重要的课题。本文就结构化P2
随着互联网和信息技术的迅速发展,存贮在各种信息系统中的信息资源通过网络互连,形成了巨大的网络信息空间;同时信息资源也愈来愈呈现出异构、海量、动态的分布特点,这些变化
纯音听力计是听功能测试的声学电子仪器,可为听力损失的定性、定量和定位诊断提供参数依据,是近代耳病诊治和听力学研究的重要设备。本文从听力计的发展趋势和面临现状出发,基于对系统结构和功能要求的分析,论述了仪器的工作原理、软、硬件设计方法和纯音信号与噪声信号的实现过程。系统采用微处理器MEG128控制信号发生电路、音量控制系统、通讯接口和电源等功能模块的协同工作,通过串行通讯实现上、下位机的数据传输。上
随着计算机和宽带网络技术日新月异的发展,以多媒体通信为主体的信息网络已成为世界关注的热点。IP网中传输的信息已由单纯的文本数据演变到丰富多彩的多媒体信息(如语音、图
语义Web将信息赋予了明确的语义含义,方便了人与计算机之间的协同工作。本体是语义Web体系的核心,是一种描述语义知识的建模手段,包含了较为丰富的自然语言描述。随着语义Web
电致化学发光是某些具有化学发光活性的物质处在一定的电位时,与溶液中氧化还原物质作用生成的不稳定激发态迁移回基态时所导致的化学发光现象。电致化学发光分析是最近发展起来的一种新型的分析方法,是化学发光、电化学、生物分析、微电子技术以及传感技术相结合的最新产物。随着计算机、电子技术的发展,尤其是传感器技术与生物芯片分析技术得到了更多的重视,化学发光分析技术在化学分析、药物分析、生命科学、农业、环境监测和