融合越南语语言特征与改进PCFG的越南语短语树库构建

来源 :南京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:kukakei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短语树库是自然语言处理的研究和实际应用的重要资源,就越南语而言目前也缺乏这类树库资源,不利于汉越双语信息处理工作.提出一种融合越南语语法特征与改进PCFG(概率上下文无关文法)的越南语短语树库构建方法,能够自动分析出越南语的短语结构树,从而可解决了越南语短语树库的自动构建问题.首先通过分析越南语的语言特征,制定出越南语的语言特征集;然后利用Inside-Outside算法从人工标注的少量越南语短语树获取PCFG模型中的语法规则集;最后将语法特征集作为语法规则集的补充融入PCFG模型,用得到的新模型最终完成
其他文献
采用亚磷酸二甲酯与顺丁烯二酸酐为原料,合成亚麻阻燃剂PX;以自制的降解壳聚糖和PX为底物,合成了新型亚麻织物阻燃整理剂JPX,用电位滴定法测定其取代度。对PX和JPX整理后织物的续
纪实是影像的重要功能。若除去那些直接对实物拍摄的影像,动画技术的产生和发展也提供了大量的人工影像。关于动画能否成为纪录片的问题引发了理论界的争论,但纪录片的合法性
为进一步强化公司的技术创新能力和运营效率,不断提升综合竞争力,安诺其公司拟投资约2.5亿元人民币用于建设“安诺其集团科创运营中心”。安诺其经过多年的快速发展,集团规模不断
国务院7月4日印发了《关于积极推进“互联网+”行动的指导意见》,明确未来三年以及十年的发展目标,提出11项重点行动,并就做好保障支撑进行了部署。《指导意见》围绕转型升级任务
汉代社会向上的律动表现出汉时代的雄伟的气势和生生不息的创造力,汉碑的雄健浑厚造型,充满张力的动势,丰富的想象,古拙凝练的艺术效果,使它和汉青铜器纹饰及汉隶书一样,具有
将近红外光谱技术与支持向量机(SVM)相结合建立分类模型,用于棉、麻织物的快速无损鉴别。选用径向基函数(RBF)作为核函数,分别采用网格搜索法、遗传算法和粒子群算法对惩罚参数c和
非负矩阵分解算法(Nonnegative Matrix Factorization Algorithm,NMF)已经广泛地应用于诸多领域,但它容易受到异常点的影响.各种针对这个问题的改进方法中,使用L2,1范数的鲁棒
采用溶胶一凝胶法制备了活性炭(Ac)负载Fe离子掺杂的TiO2光催化剂(Fe-TiO2/AC),并对其进行了XRD、N2吸附-脱附和XPS等表征,通过光催化降解印染二级废水,考察其催化性能。结果表明,1.5%Fe
介绍了冷转移印花的原理和流程,针对转印过程中容易出现的渗化、花虚、阴阳色、露底、色点、皱条、纬弧等十二类疵病进行原因分析,并提出预防措施.
在我国全面布局生态文明建设的背景下,“十三五”期间中国纺织工业将从建立机制、技术和产品以及循环经济三个层面推进生态文明建设。中国纺织工业联合会有关负责人表示,在中国