基于互信息改进算法和t-测试差的壮文分词算法研究

来源 :中南民族大学学报:自然科学版 | 被引量 : 0次 | 上传用户:jianglihongnj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的壮文分词方法将单词之间的空格作为分隔标志,在多数情况下,会破坏多个单词关联组合而成的语义词所要表达的完整且独立的语义信息,在借鉴前人使用互信息MI方法来度量相邻单词间关联程度的基础上,首次采用互信息改进算法MI-k和t-测试差对壮文文本分词,并结合两者在评价相邻单词间的静态结合能力和动态结合能力的各自优势,提出了一种MI-k和t-测试差相结合的TD-MIk混合算法对壮文文本分词,并对互信息改进算法MI-k、t-测试差、TD-MI-k混合算法三种方法的分词效果进行了比较.使用人民网壮文版上的文本集
其他文献
中西方文化差异是影响学生领会、掌握和运用外语的重要因素。学习一种外语必须了解这种语言所承载的文化。在大学英语教学中,教师在阅读、视听说、词汇和语法等教学活动中适
<正>建国以来,北京市的玉米品种工作有了长足发展,先应用和推广农家种,以后又推广杂交种,到80年代末,已进行了生产用种的三次更新换代.但有关玉米品种性状遗传改进研究,未见
结合“金领广场”施工实例,介绍了桩基础的基础选型,说明了预制预应力管桩的设计参数的取值,阐述了预制预应力管桩组织施工的质量控制措施,具有一定的参考价值。
针对潜水泵本身没有配备矿井运输辅助装置而无法满足应急救援时的及时响应问题,设计了适应性强的矿井应急救援潜水泵移动列车。该车实现了将潜水泵快速准确运送至矿井积水的
本文回顾了玉米体细胞培养的历史,综述了抗病筛选的进展,讨论了组织培养技术应用于基础研究和育种实践中存在的问题并展望了应用前景。更多还原
目的:观察润肺散结汤治疗气阴两虚痰浊泛肺型晚期肺鳞癌的临床疗效。方法:将60例气阴两虚痰浊泛肺型肺鳞癌患者随机分为两组,治疗组服用润肺散结汤,每天1剂,早晚分服;对照组采
李庆海教授认为,胸痹的病机总属本虚标实,本虚为气血阴阳亏虚,标实为痰浊、气滞、寒凝、血瘀、虚实相互夹杂。治疗常以《金匮要略》中的瓜蒌薤白半夏汤加减治疗,疗效满意。
中华法文化成为世界文明体系的一部分,中华法系被认为是世界法系中最具张力的一脉。而刑罚执行文化则是这一脉中精彩的一页:教化思想的沿袭、人性思想的传承、革新思想的引领
期刊
对50个玉米自交系,4个测验种中的NC—Ⅱ交配组合进行了试验.以50个自交系的一般配合力及特殊配合力为指标,采用系统聚类法进行聚类分析.结果表明,利用配合力为指标将50个自交