Nutch-0.8.1中二分法中文分词的实现

来源 :计算机时代 | 被引量 : 0次 | 上传用户:pan303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量信息在网络上的出现,使搜索网站应运而生,越来越多的搜索工具受到关注。Nutch是一个开源Java实现的搜索引擎,扩展性较好,是人们研究的热点。现今出现的Nutch-0.8.1较好地处理了英文分词,但没有对中文分词进行处理。文章介绍了在Nutch-0.8.1中实现索引及检索的二分法,指出在中文分词上它比原Nutch-0.8.1有了明显的改善。
其他文献
选取1999—2013年新疆阿克苏地区制造业与生产性服务业增加值数据,进行ADF检验和协整检验,得出生产性服务业与制造业在阿克苏地区存在长期稳定正相关关系的结论,并建立了短期
学分制的实施需要深厚强大的资源基础,对学校资源和管理制度提出了挑战。由于客观因素导致现实教育实践活动中,对学分制内涵的理解出现了层次性:针对某门课程的学分;针对某个
We investigate the design of satellite network slicing for the first time to provide customized services for the diversified applications,and propose a novel sc
随着社会的发展以及时代的进步,数字广播技术得到广泛应用,受到了更多人的重视。并且其在网络媒体的冲击之下仍然发挥着重要的作用,数字音频编播系统在其中发挥了很大作用。
Lane detection based on machine vision,a key application in intelligent transportation,is generally characterized by gradient information of lane edge and plays
摘要:社会保障工作中的“金保工程”不断取得进展,利用信息系统进行决策分析的需求日益增加,为了构建决策分析系统需要整合社会保障信息系统中的养老、医保、就业、人才四本数据库的资源。文章探讨了数据整合技术在社会保障信息系统中的应用。  关键词:社会保障;金保工程;数据整合;决策分析    0 引言    为了全面、准确、及时地收集社会保障业务信息,充分挖掘数据库中数据的价值,需建设一个宏观决策系统,借助
Transfer learning aims to transfer source models to a target domain.Leveraging the feature matching can alleviate the domain shift effectively,but this process
《粤港澳大湾区发展规划纲要》的发布为大湾区内各高职院校的发展提供了有利契机。针对大湾区的经济发展现状和未来产业布局,以珠海市高等职业院校在新工科专业建设方面的实
With the inclusion of satellite Internet as the information infrastructure in China's "new infrastructure" category,relevant domestic industries and scienti
安全、环保、节能是汽车工业发展的永恒主题。7月23日日本13产汽车公司中国事务所专门安排了其日本国内总部科技研发部门专门从事安全环保的技术专家并特意邀请国内汽车行业