一种基于Lucene的Hash改进中文分词算法的实现

来源 :第十二届全国青年通信学术会议 | 被引量 : 0次 | 上传用户:wzhl512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是搜索技术的一个核心问题,在分析Lucene结构的基础上,采用一种改进的Hash分词算法,设计出一种高效的中文分词模块。
其他文献
本文建立两种星座模型,并分析讨论各自的轨道高度和卫星数量的参数与覆盖特性之间的关系.仿真结果和报告显示,不同形状星座的卫星通信系统,具有覆盖特性的差异,最后简要分析
采用Altera公司的第二代FPGA嵌入式处理器--Nios Ⅱ系列软核处理器为核心,采用双CPU技术,实现MP3的解码播放和实时歌词显示系统。在设计当中充分地体现了NiosⅡ软核处理器强
目的了解奈诺沙星对MTB、胞内分枝杆菌和脓肿分枝杆菌临床分离株的体外抗菌活性。方法分别纳入MTB、胞内分枝杆菌和脓肿分枝杆菌临床分离株128、80和50株。以微孔板倍比稀释
在文本有关的说话人识别中,HMM是目前常用的方法之一,而在文本无关的说话人识别领域,主流的方法则是GMM.HMM假设给定状态的特征矢量相互独立,GMM假设所有的特征矢量相互独立.
用他自己的话来说,詹姆斯·N·舒勒里(James N.Shoolery)对核磁共振波谱学的主要贡献在于他曾是一位“产品冠军”。三十年前,他帮助制造了第一台商业用核磁共振波谱仪,并且
你到施脱拉斯堡(Strasbourg)来吧?在这里你可以经常听见许多谰言,在法国的工厂与鲁尔(Ruhr)德国的工厂之间往来的买卖是很热闹的.——一个通讯员对我这样说.他这样的控诉是
在三国交界处我们来到瑞士第二大城巴塞尔市郊的“三国角”。巴塞尔位于瑞士、法国和西德三国交界处,“三国角”更处于三国边界的相交点上。莱茵河在我们面前横贯南北,河西
本文设计了开关电源中的带隙基准源电路,首先阐述了带隙基准源的功能和基本原理,并结合开关电源集成电路整体的性能对带隙基准源部分提出了具体的设计指标;同时结合具体工艺进
本文介绍了一种基于IEEE1149.1标准的JTAG IP核的设计与实现,采用可综合的Verilog HDL进行描述,按设计流程进行仿真验证,仿真结果证实了设计的可行性。同时,根据基于JTAG标准