传统蒙古文“同形不同码”问题研究

来源 :信息技术与标准化 | 被引量 : 0次 | 上传用户:zlotu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计并实现了一种基于语料库的传统蒙古文同形不同码识别系统。通过网络爬虫获取原始语料,然后对语料进行预处理并生成词表和倒排索引。基于词表利用GDI和传统蒙古文字库对每个传统蒙古文词生成字形图,并根据字形图之间的相似度识别出相同的字形。系统根据倒排索引、同形词列表统计出语料中传统蒙古文同形不同码的情况。实验结果显示,同形不同码问题在传统蒙古文中普遍存在,反映出了制定相关标准的迫切性。
其他文献
建立了检测芒果畸形病的有效方法。利用Fusariumproliferatum的钙调蛋白基因序列设计外侧引物PRO1/PRO2和内侧引物O1/O2,采用引物PR01/PRO2可以从芒果畸形病病原菌基因组中扩增出
In this study, the relationship between mothers' self-efficacy perception and their communication with their children has been analyzed. Ninety-four mothers havi
习近平总书记在学校思想政治理论课教师座谈会上的重要讲话中强调指出:“要坚持政治性和学理性相统一”“要坚持价值性和知识性相统一”“要坚持建设性和批判性相统一”“要坚
报纸