一种中文分词词典新机制——双字哈希机制

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:sniper0928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率.本文首先分析了分词词典机制在中文分词中的重要性及已有的三种典型词典机制,并在此基础上根据汉语中双字词语较多的特点提出了一种新的分词词典机制--双字哈希机制,在不提升已有典型词典机制空间复杂度与维护复杂度的情况下,提高了中文分词的速度和效率.
其他文献
农村义务教育日益受到政府重视,陆续出台了免收学费、书本费,给予家庭贫困生部分生活补贴的优惠政策,免除了农民因子女教育可能背负的沉重负担。然而,农村教育又出现了另外的隐患
2006年,樱花公司根据中国市场特点以及市场需求,推出了THC甜蜜樱花专业眼护品牌。经过市场近一年的检阅,得到渠道和终端消费者的广泛认可。该品牌正是以其良好的市场口碑、明确
蒙古文是一种复杂文字,目前操作系统和办公套件都还不支持蒙古文的显示。OpenOffice.org是可以运行在Linux和Windows上跨平台的办公套件,它分别使用ICULayoutEngine和Uniscribe