基于归一化点向互信息的低资源平行语料过滤方法

来源 :通信技术 | 被引量 : 0次 | 上传用户:pqx98
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经机器翻译的效果严重依赖于平行语料的规模和质量,而当前的平行语料抽取方法和生成方法只能提供规模足够但质量不佳的平行语料.因此,要在这些大规模低质平行语料上训练高质量的神经机器翻译系统,需要对这些平行语料进行有效过滤.针对这一问题,引入了归一化点向互信息算法来抽取噪声语料中的对齐信息,利用其中可靠性高的对齐信息来过滤噪声语料.利用该方法在OpenSubtitles的泰语—汉语翻译方向上提高了5.8个双语评估替补(Bilingual Evaluation Understudy,BLEU)值,汉语—泰语翻译方向上提高了10个BLEU值.此外,该方法在2020年国际机器翻译大赛给出的柬埔寨语—英语单向翻译任务中实验,得到的结果比基线高了0.4个BLEU值.
其他文献
岩体灾害孕育过程中引起的岩体变形、破坏,会改变岩体的声学特征,在工程中可通过观测声波在岩石内部传播变化判别岩石的稳定性和承载状况.为了确定砂岩裂纹扩展不同阶段声波传播规律与破坏模式,通过声波监测装置及岩石破裂全过程分析系统RFPA2D研究单轴压缩下砂岩在不同应力水平下波速变化及破坏模式.结果表明:砂岩在进入弹性加载阶段前波幅增速最大,在随后的弹性加载阶段纵波波速增长速度最快,在发生宏观破坏前纵波波速达到最大;根据裂纹应变模型得到裂纹闭合应力σcc约为0.19σc;裂纹起裂应力σci约为0.28σc;在体应
近年来,在国家“碳达峰、碳中和”的目标背景下,大量不同投资主体的风电和光伏电厂接入电网,小型地方电厂与新能源站点占比越来越高,随之带来的一系列网络安全风险也逐渐增大.现就地方电厂和用户站并网面临的网络安全风险进行详细分析,同时提出相应的安全防护措施.
随着5G业务发展,运营商园区业务日渐规模化,核心网络下沉部署后网络安全及业务安全尤为重要,通过探索运营商ToB网络安全手段、IT互联网领域安全架构,为运营商园区ToB网络及边缘计算节点的安全部署提供参考.
电力行业在快速发展的同时也出现了很多问题,如何更加有效提升电网能源利用率是当前电力行业研究的重点.随着科技的快速发展,智能电网的建设速度也在不断加快,而分布式电源作为智能电网的重要组成部分,其先进性决定了电网的可靠性和稳定性.因此从经济效益等角度出发,需要不断加大对分布式电源的研究力度,以便更好的促进我国经济的快速发展,保证电网的安全运行.如今电力行业在市场竞争和环境保护等方面面临的压力在不断增加,与此同时传统能源正逐渐被可再生能源替代,而分布式电源具备较高的灵活性和适用性,凭借先进的材料技术和制造工艺,
在变电运行中,红外线测温技术是其故障检测的关键技术.通过红外线测温技术的应用,可实现隔离开关发热故障、金属夹发热故障、高压套管故障、环氧树脂注射型CT内部缺陷以及高压开关柜故障的准确检测,以此来为其故障处理提供科学支撑.基于此,对变电运行中红外线测温技术的应用进行分析,可以为保障变电运行效果提供参考.
随着市场经济的转型,科学技术不断进步,全球能源危机的爆发使得能源供应技术也与国家节能减排同步发展.开关电源在不断变化,以降低功耗为主要研发方向,低频模式逐渐向高频模式转变,总体发展面向建模.而电力电子技术能够将高频变频电源的交流电通过变频技术转换为直流电,因为具有显著的节能效果,所以在生产中得到了广泛应用.
太阳能和风能电站运行过程中,开关站内铁磁式电压互感器发生故障的频率最高,但又是不可或缺的元件,所以需要对电压互感器故障原因进行分析,找出避免故障的方式方法,以确保太阳能和风能电站的安全送电.
随着电力电子技术的发展,电压浪涌对精密设备造成的影响也越来越大,传统的电压浪涌抑制方法已难以满足要求.对此提出一种基于MOSFET的浪涌防护设计,简述了其浪涌防护的原理并提供了一种切实可行的电路设计方法.通过对设计的电路进行仿真验证,表明该电路设计对电压浪涌具有快速抑制效果,可以有效避免后级电路遭受电压浪涌的损害,为开关电源设计提供了一种新型的电压浪涌防护方法.
蓄电池是变电站直流系统的关键部分,其可靠系数直接影响着变电站的安全性能,是新时期变电运维管理的重中之重.针对变电站蓄电池的故障情况及运维现状,设计一款新型蓄电池故障监测系统,利用实时监测及远程控制,快速实现充放电保护、故障投切以及在线维护等,旨在最大限度降低由蓄电池故障引起的变电风险.
现阶段,由于跳频通信具有极强的抗干扰能力,因此被广泛应用于军事信息传输等.针对自适应跳频通信系统的相关技术进行分析,在了解自适应跳频通信技术发展的历史进程前提下,结合现状系统地阐明了该系统运行的工作原理,进而为自适应跳频通信系统的实时高效运行提供建议.