基于Hash结构的机械统计分词系统研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:guokm01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在综合比较了常用的机械分词方法和统计分词方法基础上.论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机械分词方法和统计分词方法,结合了两者的优势,并对其做了一系列的改进。从对测试结果的分析可以看出,系统的分词速度达到了每秒一万两千个汉字以上,且具有较强的未登陆词识别能力。
其他文献
针对一片装配式钢混组合试验梁,依次开展了在无损伤和多种损伤工况下相同试验荷载的加载试验,运用叠差分析与轮廓线提取算法对全息拼接图像进行处理,得到结构全息轮廓线以及
同志们: 在“三八”国际劳动妇女节前夕,我们在这里隆重集会,对获得全国五一巾帼奖的先进集体和先进个人进行表彰,并向她们颁发“全国五一劳动奖状”和“全国五一劳动奖章”
简要阐述了目前国内外学者在JPEG图像篡改的被动取证技术方面的主要研究成果。基于篡改和检测方法的不同,目前检测方法可分为双重JPEG压缩检测方法和JPEG块效应不一致性检测
清理和规范投资项目在报建过程中的审批程序,是近几年国家重点关注的工作之一,这是降低企业投资成本、激发社会活力的重要举措,而项目建设开工管理就是其中一个环节。在《国
针对在微藻规模化养殖过程中,光生物反应器监控预警系统可扩展性差和管理分散的问题,设计一种在微藻养殖过程中对光生物反应器内培养液的温度、pH值和光照强度等环境数据进行实
目的 探讨儿童良性癫痫伴中央颞区棘波(BECT)变异型的电-临床特征、治疗及神经心理学预后。方法 对病程中出现失神样发作、粗大震颤、运动不协调(Ⅰ型)或言语及口部运动障碍(Ⅱ型)
移动互联网与新媒体技术日新月异地发展,对高职学生的学习、生活造成了方方面面的影响,高职院校要深刻分析新媒体对学生造成的负面影响,"多管齐下"提高学生的媒介素养,引导学生
"话题"是指一个种子(核心)事件或活动以及所有与之直接相关的事件和活动。近年来,媒体传播新闻事件时开始注重发掘或制造话题。如何利用话题取得更好的传播效果,成为媒体人关心的
采用铜离子处理腈纶,再与水合肼及反应助剂组成的混合水溶液反应,制备了阻燃腈纶,探讨了处理工艺条件对纤维性能的影响。结果表明:在水合肼加入量20mL,w(NaOH)为5%的NaOH4.7mL,质量分数
甘南草原位于甘肃的西南部,这里历来为藏族人民的天然牧场,为四周群山环抱,中间的高山草原开阔平坦。大夏河水从南到北徐徐流过,水草丰茂、风景优雅、蓝天白云下牛羊成群,一派自然