浅议基于GIZA++的汉英手动词对齐法

来源 :海南广播电视大学学报 | 被引量 : 0次 | 上传用户:ks00459
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于统计和计算的自动词对齐法优点在于以词的频率与分布情形来猜测词的对 应,只需要大量语料库、不需要机读词典或语言知识即可搜寻出句子的对应.这种方法的缺 点是准确率受频率、语系、文类、风格等因素影响很大.针对这-不足,提出基于GIZA + + 的 手动汉英词对齐法设想,主要思路是先通过GIZA ++工具进行预对齐,在此基础上再进行人 工编辑和对齐.实验证明:与单纯的无监督对齐法相比,速度大幅提高;与其他纯自动词对齐 法相比,准确率有所提高.
其他文献
利用变量代换解普通的微分不等式,对Bellman不等式进行了适当的推广,并举例说明这一推广后的不等式的一个应用,推广了文献[4]中定理6的一个结论.
以自适应控制理论为基础,对非自治混沌系统的参数辨识研究,针对During系统和一离心调速器混沌系统,设计了有效的自适应控制律,实现了一类非自治混沌系统所有参数准确和快速的辨识
研究一类具有边界记忆项的非线性波动方程的初边值问题,利用Galerkin方法、紧性原理得到了整体解的存在性,利用补偿能量法得到了解的渐近性.
采用Davidson修正的高精度的内收缩多参考组态相互作用方法(MRCI+Q)及Dunning等的相关一致基aug-cc-pV6Z,计算了BS自由基X^2Σ^+、C^2Π和G^2Σ^+电子态的势能曲线.对势能曲线进行
从形式句法学研究视角对汉黎量词短语句法特点进行对比分析,主要考察数量词短语线性语序、周遍性量词短语、量名一致等几个方面句法问题,以期从理论上对汉黎量词短语句法差异