融合越南语语言特征与改进PCFG的越南语短语树库构建

来源 :南京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:kukakei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短语树库是自然语言处理的研究和实际应用的重要资源,就越南语而言目前也缺乏这类树库资源,不利于汉越双语信息处理工作.提出一种融合越南语语法特征与改进PCFG(概率上下文无关文法)的越南语短语树库构建方法,能够自动分析出越南语的短语结构树,从而可解决了越南语短语树库的自动构建问题.首先通过分析越南语的语言特征,制定出越南语的语言特征集;然后利用Inside-Outside算法从人工标注的少量越南语短语树获取PCFG模型中的语法规则集;最后将语法特征集作为语法规则集的补充融入PCFG模型,用得到的新模型最终完成
其他文献
纪实是影像的重要功能。若除去那些直接对实物拍摄的影像,动画技术的产生和发展也提供了大量的人工影像。关于动画能否成为纪录片的问题引发了理论界的争论,但纪录片的合法性
汉代社会向上的律动表现出汉时代的雄伟的气势和生生不息的创造力,汉碑的雄健浑厚造型,充满张力的动势,丰富的想象,古拙凝练的艺术效果,使它和汉青铜器纹饰及汉隶书一样,具有