集成多种策略模型的维汉神经网络机器翻译系统

来源 :现代计算机 | 被引量 : 0次 | 上传用户:xxm181512619
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络机器翻译已经成为机器翻译研发的主流技术,但是大多数低资源语言仍然没法研发可使用的机器翻译系统。研究人员为了克服数据不足问题,提出了反向翻译、知识蒸馏、模型平均等多种辅助提高翻译模型性能的方法。虽然,这些方法单独使用能带来一定的提升,但是集成多种策略后的效果仍不明确。本文以全国机器翻译大会的维汉机器翻译评测任务目标,对多种策略分别进行实验,然后集成多种策略所得到的翻译模型实现了性能得到显著提升的维汉翻译系统。
其他文献
针对大学生因性格、生活习惯不同而被室友孤立的问题,提出一种基于K-means算法的寝室分配方法。首先用调查问卷对学生的性格和生活习惯进行收集,然后根据同性别数据的相似性,使用K-means算法划分,并得到最为合适的边界条件,最后基于选定的条件来进行寝室分配。通过这种方式,寝室相处会更加和谐。
HDFS的默认副本放置策略较为简单,若随机选择的节点负载过重,会影响HDFS的文件写入速度。为改善这一问题,提出了一种基于KNN的副本放置策略模型KRPM(KNN Replica Placement Model)。该策略中,数据节点会将自身的特征通过心跳发送给名称节点,通过训练好的KNN回归模型对节点的写入速度进行预测。若随机选择的节点预测值小于集群的平均值,则重新随机选择,直到选择到符合条件的数据节点。实验表明,新的策略能够提高HDFS的文件写入性能。
27.5kV交联聚乙烯单芯电力电缆在我国高铁牵引供电系统中应用广泛。目前27.5kV高压电缆及附件故障率比较高,难以对电缆缺陷和故障准确定位以及实时监测,影响到牵引供电设施的安全运行。通过研究运用物联网技术、地理信息系统(GIS)技术、空间索引技术等信息技术,对电缆信息有效、实时、自动化的采集,采用数字化运维和智能化监控手段,实现对电缆全路径在线监测、故障判断和精准定位。
从供配电系统、智能化系统方面介绍了某大型医疗建筑电气设计,提出了若干现阶段医疗建筑电气绿色、节能设计的实用方案,以供电气设计人员对医疗建筑进行电气设计时参考。
随着微博平台的广泛流行,越来越多的新闻媒体通过微博发布新闻资讯。对微博新闻用户进行聚类研究,可以帮助新闻媒体结合自身特点,针对性发挥自身媒体作用,提供更好的内容推送。首先构建基于层次聚类法的微博新闻用户聚类模型,运用数据采集软件获取用户数据,再采用SPSS软件对其进行聚类分析和聚类结果的描述统计。根据聚类结果结合相关特征值的现实含义,将微博新闻用户分为三大类,并针对各类媒体特征提出指导建议。
HolliView产品页面采用Canvas绘制,Canvas是一个图形容器,为实现画面上元素特性的自动化组态及测试,首先需定位到画布上需要操作的元素,而Selenium的基本定位方式只能定位到该画布上,无法定位到画布上的具体元素,因此需要使用Selenium的JS注入的方式,通过插入JS脚本的方式获取所要操作的元素坐标,再使用ActionChains对应的鼠标动作去执行对应的操作。目前画面元素动态
以某研发办公大楼项目设计为例,分析了民用建筑低压直流配电不同电压的供电半径,确定了低压直流电压等级;对比了单极、双极母线架构的优缺点,选择了适合项目规模的双极母线架构;讨论了数据中心不同高压直流供电架构的效率与可靠性,并介绍了一种结合光伏发电的市电+光伏高压直流双路电源的数据中心供电方案。提出建筑内的储能蓄电池与传统UPS蓄电池不同,应主要关注蓄电池的循环寿命和消防安全性能,阐述了水系锌离子电池储能方案及直流充电桩配置选择,并给出了项目直流配电系统经济模式的运行策略。
近年来,随着各种便捷支付方式的普及,银行账户交易数据呈现爆炸式增长,同时数据模型也在不断变化,传统关系型数据库已难以满足这种海量的、模式灵活、高可用、高性能的数据存储和查询需求。通过对银行历史交易数据查询业务特点的分析,本文提出一种基于MongoDB数据库的银行海量历史交易数据查询解决方案,方案包括系统架构、数据模型、索引设计和分片键策略。实验表明,MongoDB能够实现海量的交易数据的存储和快速查询能力。
随着科学技术的快速发展,无人机因其作业方式机动灵活、功能多样化、成本较低、时效性好等优势在电力巡线、地图测绘、道路巡检、空气质量监测等领域得到广泛应用。同时,我国航空产业正处于高速发展阶段,对于飞机表面检查的工作要求越来越高,传统的目视检查、无损探伤等检测手段因其低效性、不安全性、精度差等问题已经不能满足航空产业的检测技术需求。针对上述问题,提出一种基于无人机航拍影像的多目标航前检查方法。对比多边形和兴趣点两种航迹规划手段,从建模质量、航测面积、飞行距离、飞行时间、照片数量等方面进行分析。研究结果表明,虽
双语词典的构建方法一直是人们研究的重要方向。随着近些年理论水平和硬件性能的不断发展,基于深度学习神经网络的算法,在各个研究领域都取得了很大的突破。本文利用爬虫技术从网络上爬取汉英双语语料,经过分词、去停用词、词形还原等处理后,通过神经网络训练汉英双语语料,得到双语词向量,进而构建出汉英双语词典。实验结果表明,该方法在构建双语词典方面具有良好的效果。