一种消除中文分词中交集型歧义的方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:jpy_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
切分速度和精度是中文分词系统的两个主要性能指标。针对传统的中文分浏中出脱的分词速度慢和分词精度不高的问题,采用了双层hash结构的词典机制来提升分词的速度,对于匹配结果中出现的交集型歧义字段,通过互信息的方法来消除,以提高分词精度。并对该分词系统进行了实现。通过与传统的中文分词系统的分词速度以及分词效果的对比,发现该系统在分词速度和精度上都有所进步,从而取得较好的分词效果。
其他文献
【摘 要】在新课改的不断推动下,我们要逐渐重视起对学生的综合能力培养,培养学生的学习素质,语文写作作为初中语文教学中的一个关键要点,也一直是初中语文教学中的一个难点,因为在这个时期,大部分学生都没有养成一个系统的写作思维,同时自身的语文作文写作习惯、方式等都存在或多或少的问题,同时教师在语文写作教学中并不能针对性地进行教学,许多教师的教学方式都存在很大问题,如果不能解决教师在语文写作教学中的这些问
随着嵌入式技术的快速发展,各种嵌入式技术已经应用于人们日常生活当中,基于网络的楼宇集中控制器就是将嵌入式技术应用到楼宇用电管理当中,为用户用电管理提供了有效、便捷的途径。基于网络的楼宇集中控制器构建于高性能的ARM9硬件环境和开源、稳定、安全的嵌入式Linux软件系统平台,同时系统服务程序采用多线程系统架构,实现系统服务高效性。该嵌入式系统通过RS485和基于TCP/IP的网络通信实现信息的收集、
随着计算机图形学的发展,立体匹配技术已经成为三维场景恢复中一项重要的手段,视差估计是立体匹配中的关键基础技术。为了能够更好进行三维场景恢复,改善视差的工作便迫在眉睫。主要研究了在基于模板的可信传播立体匹配算法中改善视差初始值的算法:通过引入梯度差算子与绝对差和算子加权的匹配代价,运用交叉检验估计及WTA优化初始视差矩阵,进而提高初始视差值的准确性,从而改善最终的视差结果。经实验证明,本方法能够很有