藏文紧缩格识别方法

来源 :计算机应用研究 | 被引量 : 8次 | 上传用户:heroszk2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分词是自然语言处理的一项基础性工作,对自然语言处理的后继工作有较大的影响。紧缩格的识别是藏文分词中最难、最重要的技术之一。通过剖析已有藏文紧缩词识别方法,分析藏文字词的特征,针对性地提出了识别藏文紧缩格的规则算法、添加—还原算法和最大熵模型的特征模板,从而得到基于规则、添加还原法与最大熵模型相结合的藏文紧缩格识别方法。实验数据表明,该方法识别藏文紧缩格的准确率、召回率和F1值分别达99. 26%、96. 47%、97. 85%,比现有最高的准确率有了较明显的提高。
其他文献
单词的统计特征在自然语言处理中具有广泛应用。针对统计特征对关键词抽取和文本分类精确度的影响,分析了八种常见的统计特征,通过情感词抽取和商品评论分类,研究统计特征在情感分析领域中的作用。利用八种统计特征构造文本向量空间模型,替代基于单词构造文本向量空间模型的方法,能够降低文本向量的维度,具有隐形语义空间(LSA/SVD)的压缩效果,在保证分类结果准确率的前提下有效降低了算法的复杂度,能够替代传统的向
针对列控系统的安全性和实时性要求,基于CTCS-3级列控系统需求规范中等级转换场景建立C2级向C3级转换的UML(统一建模语言)模型和有色Petri网(CPN)模型,分析了影响列车安全运行和行车效率的因素,即转换时长和转换成功率,验证了该建模方法的有效性。验证结果表明,UML和CPN模型相结合的方法适合于列控系统需求规范的验证。搭建的等级转换模型能够满足系统实时性要求。在保证切换成功率的前提下,列
针对滑模控制系统中存在抖振严重、收敛速度慢的问题,设计了一种带饱和函数的幂次滑模趋近律。该趋近律通过饱和函数和两个幂次项系数在系统趋近过程不同阶段进行针对性调节,提高了系统动态响应过程的收敛速度,且有效削弱了抖振,从理论上证明了其存在性和可达性。将该趋近律应用到存在干扰的二力臂机械手名义模型控制系统中,结果表明,所提出的趋近律提高了系统的收敛速度,而且有效抑制了系统的抖振。
针对三值固定RM(fixed polarity Reed-Muller,FPRM)逻辑电路面积与延时综合优化问题进行了研究,提出了一种基于竞争行为多目标离散粒子群算法(multi-objective discrete competitive particle swarm optimization,MODCPSO)的极性搜索方案。首先在MODCPSO算法中引入竞争行为机制,将种群划分为不同的团队,从