统计机器翻译的多维度参数训练及解码研究

被引量 : 0次 | 上传用户:jiangyingzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,全世界人们的联系愈发紧密。机器翻译因为便捷、免费的优点,成为联结使用不同语言的用户之间的重要桥梁。虽然机器翻译技术已有了很大发展,但它的译文与人工翻译之间还有着很大差距。就目前普遍使用的基于短语的统计机器翻译系统而言,就有许多有待改进之处。在统计机器翻译现有的解码算法中,一般为了缩减搜索空间,都必不可少地会引入剪枝策略,但这随之又会带来搜索错误的问题,即不能找出模型对应的最佳译文。本课题的研究便在此问题上展开。针对这个问题,本文制定了详细的研究方案。在现有技术的基础上,我们提出了多维度的解码方法。与传统方法不同,在解码一个句子的过程中,该方法会使用多组参数权重。而针对这多组参数权重的训练,我们又进而提出了多维度的训练方法。这两种方法与以往有着显著区别的是,不是针对句子,而是粒度更小的推导。并且在参数训练的过程中,我们引入了强制解码的方法来获取参考推导。最后,我们使用Cubit解码器和MERT工具,对多维度的解码及其训练进行了实现。然后通过合理的实验设置,我们设计了多组实验来验证这两种方法的有效性。结果表明,通过使用更有针对性的参数权重,搜索错误有所减少,翻译效果得以提升。
其他文献
目的:研究CAD/CAM技工室系统中不同光学印模方法及肩台形态对氧化锆全锆冠的边缘密合性的影响,为临床牙体预备及印模方式的选择提供参考。方法:设计并制备右下第一磨牙全冠预备
跨文化的文化教育在全球范围内盛行,促进了各国文化教育的交流,研究学者们致力于研究不同国家的教学法和教学理念,在对比和借鉴中努力发展完善自己国家的文化教育。日本与我国同
经济全球化给企业带来的显著变化之一是竞争空间大范围的扩展,由此导致企业各生产要素来源选择的多样性及市场竞争模式的变化,越来越多的企业在注重规模化效益的同时,把提升供
目的观察连续血液滤过对高脂血症性急性胰腺炎的治疗效果。方法回顾性分析自2006年1月到2013年12月在福建医科大学附属第一医院住院期间诊断为高脂血症性急性胰腺炎病人共35
目的:1.研究补镁是否可以改善6-OHDA诱导的偏侧PD大鼠的运动症状;2.补镁能否拮抗6-OHDA对大鼠黑质纹状体多巴胺系统的损伤;3.镁离子转运蛋白SLC41A1、MagT1、CNNM2在6-OHDA诱导
伴随我国经济的飞快发展,我国的生态环境成长迅速,资源开发急剧扩展、能源消耗量迅猛增加,使我国步入生态高风险的时期,传统的发展形式使我国生态污染事件的规模和损害的后果等都
在中国动画片的发展史上,许多优秀的动画作品都表现出了对云南少数民族文化的热衷和喜爱,同时,大力地去传播优秀的云南少数民族文化。但是,随着国外动画片对国产动画的冲击,国产动
本文以研究广东省城镇化发展对居民消费需求的影响为主线,层层递进,剖析了广东城镇化发展的现状、广东省城乡居民消费的特征,然后运用了协整分析的方法研究了广东省城镇化的发展
<正>早在2011年,我国义务教育课程标准就明确指出:"培养学生广泛的阅读兴趣,扩大阅读面,增加阅读量,提倡少做题,多读书,读好书,读整本的书。"我国高中课程标准中也有相类似的
目的探讨断指再植术后180天内甲皱微循环变化的特点。方法本课题使用的是我们科室现有的微循环检测仪WX一9A型,对健康手指与断指再植术后120天、150天、180天的再植指体进行甲