英汉人名音译方法的研究与实现

被引量 : 0次 | 上传用户:ivan107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器音译包括人名,地名,机构名和组织名等专有名词的音译,是自然语言处理中一个重要问题,在机器翻译,跨语言信息检索等应用中有很重要的作用。机器音译是按照发音将源语言中的词自动翻译成目标语言中的词。本文在总结出基于语音的机器音译的不足的基础上,提出了两种机器音译的方法:基于字形的音译方法和机器翻译的方法。本文从以下几个方面介绍:1.本文首先介绍了基于字形的音译框架,并在该框架下分析比较了两种音译模型:噪声通道模型和n-gram音译模型,得出了n-gram音译模型比噪声通道模型包含了更多的上下文信息。2.本文在利用传统的EM算法进行音译单元对齐的基础上,首次提出了基于音节首字母匹配的对齐方法,总结了7条常见的英汉首字母匹配的启发式规则。并将两种对齐方法应用到英语和汉语音译单元的对齐上,比较了两种对齐算法对机器音译性能的影响。实验结果显示,基于音节首字母匹配的对齐算法优于EM对齐算法。3.本文研究了如何将viterbi算法应用到英语到汉语和汉语到英语的两个方向的解码上。并利用基于字形的音译框架和n-gram音译模型,采用基于音节首字母匹配的对齐算法进行音译单元的对齐,使用viterbi解码,实现了一个英汉双向人名音译系统。4.除此之外,本文将名字看成伪句子,利用统计机器翻译的思想进行音译。统计机器翻译利用对数线性模型。实验结果显示,统计机器翻译的方法更适合于机器音译,因为机器音译是按照发音顺序进行音译的,因此没有调序过程。并且对数线性模型的方法在增加模型的特征时很方便,因此有很大的改进空间。
其他文献
<正> 明水期间,在光照充足的肥水鱼池中,由于浮游植物光合作用常常使水中溶氧达到饱和甚至过饱和,有时高达每升20余毫克。但是,在严寒的冬季,从冰层厚20—30厘米的辽宁南部到
期刊
研究案例教学法在初中政治教学中的运用能够对提高政治教学的有效性,为政治教学提供新的方向,激发学生的学生兴趣,提高学生的认知,并将所学知识应用到实际生活中,对学生的健康成长
异议股东股份回购请求权,是指对于提交股东大会表决的公司重大交易事项持有异议的股东,当该事项经股东大会“资本多数决”通过时,有权依法定程序要求公司对其所持有的股份以
直流电机是重要的工业产品,它的启动状况是影响其寿命的重要因素,因此受到人们重视。直流电机直接启动时会产生高达5~10倍的冲击电流,不但会对电机及拖动的设备造成电气和机械
<正> 美国养鱼业具有特殊的管理机构,目的和方法,一般地说来被作为“体育运动商业”。它首先服务于钓鱼的业余爱好者。为了出售商品成鱼,池塘的成鱼养殖也占了重要的地位。体
<正> 我国北方越冬死鱼,每年给生产带来很大损失,严重地(井彡)响着养鱼生产的发展。死鱼的原因主要是冰下缺氧。但黑龙江、吉林的一些渔场往往发现越冬后期溶氧量很高,可是仍
<正> 1.本文浅述了古今灸法的种类(约50余种)材料及应用。 2.本文提出了在灸法中得气、刺激量与时间关系。 3.灸法的理论基础是经络学说,它以穴位、灸的材料、热量、补泻方法
期刊
化学、物理、生物等处理会改变饲料的营养价值,反映在营养成分、瘤胃降解特性和消化率改变等方面。传统的饲料营养价值评价方法都是建立在化学分析的基础上,并未对饲料内部分
高精度速度标准源是一种提供标准速度的精密装置,应用在激光测速仪系统中,用来校正速度,根据步进电机的工作原理和工作方式,信号处理系统采用TI(TexasInstruments)公司的TMS320
鉴于大型干式气柜已在逐步取代螺旋湿式气柜,以16.5万m^3稀油密封型干式气柜为例,按照施工顺序,分为四个阶段介绍大型干式气柜的施工方法,并结合施工经验,归纳了施工中值得重视的问题及其