基于Lucene构建电力企业搜索引擎分析器

来源 :2008年电力行业信息化年会 | 被引量 : 0次 | 上传用户:boyskys
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以电力企业的业务系统为背景,以设计实现一个适用于电力企业搜索引擎的分析器为目的,提出了一种基于词库实现的分词算法.该分析器基于电力专业词典完成,解决了现有分析器分词效果不尽人意的问题.同时,采用了构建词语树的方法,加载词库时,在内存中构建一棵词语树,分词时只需要遍历树即可分出相应的词语.这解决了常用最大匹配算法的必须设定一个最大词长的限制,并且在分词效率上也有了很大的提高,避免了无意义的匹配算法.最后对该分析器和Lucene两个内置的分析器进行了比较,结果证明,对于电力企业的应用系统,该分析器无论在时间还是分词效果上都优于Lucene内置的分析器.这表明该分析器已经能很好的满足构建电力企业搜索引擎的要求.
其他文献
随着企业信息化建设的深入,应用系统的完善和广泛应用,各种业务数据的安全存储愈加重要.企业在当前多平台环境下如何将计算数据和历史数据集中并安全的存放起来,不但关系到企
电厂设备巡检是保证电站设备安全运行的一项基础工作,巡检的目的是及时掌握设备运行状况,发现设备缺陷和危及设备安全的隐患.天荒坪抽水蓄能电站将国内领先的基于RFID移动GPR
会议
以北仑发电厂的主变压器为应用实例进行电力变压器在线监测与故障诊断系统的开发应用,通过信息融合技术实现了变压器状态的在线监测及故障诊断,整个系统基于Web进行设计开发,
2000年12月27日 ,根据群众投诉 ,食用某粮店销售的大米后 ,出现不适反应 ,我们立即对该样品进行检测 ,结果在此大米中检出矿物油。此事引起了有关部门的高度重视 ,随即对全市各大小粮
在分析输电线路故障成因后,介绍了使用Delphi开发的基于实时数据共享平台的输电线路导线接头测温预警系统.阐述了系统的理论依据、功能和应用.该系统的预警功能,对保证电厂的
介绍了一体化短信平台在国家电网公司招投标业务中的应用过程.阐述了一体化短信平台及其在国家电网公司招投标业务中的应用.从应用实例可以看出一体化平台实现了对短信收发的
详细描述了SAP R3 46C系统迁移的主要方法,并通过实例分析了将基于DB26.1数据库的SAP R3 46C系统,从操作系统Windows NT Server迁移到Windows 2000 Server的具体步骤.
软交换是下一代网络NGN的核心,采用分层结构分组交换方式,提供多业务的开放环境,软交换已成为电信网向IP分组网演进的最为重要的技术.通过分析目前语音专用网的结构和功能,构
会议
针对电力设计企业中开展测绘工作的需要,对测绘图管理的需求进行了详细的分析,提出了一种适用于生产需求的测绘图信息系统模型,能够极大地促进测绘图纸的管理工作,并能够有效
介绍了IBM DWE 数据仓库技术及建立数据仓库应用的一般步骤。阐述了DB2 CUBE VIEW、DB2 ALPHABLOX 与WEBSPHERE 集成建立多维立方体模型及立方体的基本方法,实现了一个基于星
会议