基于自动句对齐的相似古文句子检索

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:LOVE85954709
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语料库语言学的兴起,基于实例的机器翻译(EBMT)得到越来越多的研究。如何快速准确地构建大规模古今汉语平行语料库,以及从大量的对齐实例(句子级)中检索和输入句子最相似的源句子是基于实例的古今汉语机器翻译必须解决的问题。本文综合考虑句子长度、汉字字形、标点符号三个因素提出了古今汉语句子互译模型,基于遗传算法、动态规划算法实现了古今汉语的自动句对齐。接着为古文句子建立全文索引,基于汉字的信息熵,本文设计与实现一种高效的最相似古文句子检索算法。最后给出了自动句对齐和最相似古文句子检索的实验结果。
其他文献
色彩艳丽的礼服裙,用色彩打造新一季的性感女人。华丽惑的亮缎、简洁的经典设计款式,将女性的万般风情一一展示,从这里,你是否发现了美容院的新商机——你的美容院是否准备好了与