基于数据挖掘等技术的半分布式搜索引擎模型

来源 :第二届全国信息检索与内容安全学术会议 | 被引量 : 0次 | 上传用户：yzqp178

【摘要】

：

本文提出了一种基于数据挖掘与智能学习技术的半分布式搜索引擎(SDSE,Semi-DistributedSearchEngine)模型,实现的系统称为PeerSearch.模型设计的主要目的:φ充分利用用户的智

【作者】

：

林劼[1]张亮[2]薄川川[2]郑源[2]

【机构】

：

天津大学软件学院,天津,300072

【出处】

：

第二届全国信息检索与内容安全学术会议

【发表日期】

：

2005年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文提出了一种基于数据挖掘与智能学习技术的半分布式搜索引擎(SDSE,Semi-DistributedSearchEngine)模型,实现的系统称为PeerSearch.模型设计的主要目的:φ充分利用用户的智能为其它用户的搜索提供帮助;减轻服务器的负担,将搜索信息的发送任务分布在各客户机上.其基本思想:把网络上的客户机归入不同类别的社区,同一社区的客户机在服务器的引导下,以P2P(Peer-to-Peer)的方式分享经数据挖掘处理过的带有用户智能的搜索信息.这些信息在客户机与远程服务器进行智能集成,为用户的搜索提供服务.从而在网络中形成区域性的信息分布式存储(各社区的客户机),以及全局的信息聚集中心(服务器).与现存的搜索引擎相比,PeerSearch减轻了服务器的负担并且利用了用户的智能,从而收到较好的效果.在模拟实验中,也证实了这一点.

其他文献

一种基于网络的英文缩略语信息的自动抽取方法

面对Internet中丰富的信息资源,本文提出了一种基于互联网,实现缩略语源词组及中文翻译的自动获取方法.本文利用缩略语构词规则来提取候选词组,利用句法规则进行筛选,实现了

会议

一种基于潜在语义的Markov网络信息检索模型

在信息检索中,查询与文档集的词不匹配使得查询的查全率(recall)和查准率(precision)均较低.为了提高检索效果,查询扩展是一种较好的方法.Markov网络是一种图形表示方法,它具

会议

潜在语义查询扩展Markov网络信息检索查全率查准率

关于广义向量空间模型中布尔运算的修正

本文对广义向量模型进行了全面系统的介绍,对其存在的问题和不足进行了认真的讨论和分析,通过对该模型中交运算的重新定义建立了修正的广义向量空间模型,并从理论上证明了新

会议

广义向量空间模型重新定义向量模型交运算证明系统理论

基于P2P的搜索技术和方法研究

在基于Peer-to-Peer(P2P)的搜索技术和方法可以达到传统搜索模式所无法达到的深度和广度,具有更强的有效性和准确性,为搜索模式的进一步发展提供了新的理念和研究思路.本文首

会议

搜索技术搜索模式研究与发展搜索方法技术特点准确性资源思路描述理念基础

天罗Web信息采集系统中的性能优化

随着Web信息的爆炸性增长,对Web信息采集的性能提出了巨大的挑战.本文介绍了天罗Web信息采集的总体结构和性能优化策略.在性能优化策略中详细分析了优雅采集、页面采集、页面

会议

信息采集系统优化策略页面采集性能重复网页页面刷新集中分析分布式多线程采集器爆炸性增长陷阱实验结构存储

基于站点的Web信息采集器研究

基于站点的采集器是一类有针对性的采集器,它以站点作为采集的单位.本文在总结以往工作的基础上,首先说明站点采集自身的特点,然后讨论如何提高其性能,最后是实际的系统介绍

会议

信息采集器性能系统基础单位

Schema引导的多媒体标注技术

以MPEG-7为主要技术背景的基于内容的多媒体检索,主要用来描述低层语义的问题,它的缺陷是对高级语义的支持不足,无法建立对多媒体相关行业复杂元数据的支持.本文提出了一个基

会议

基于GNPIMk和SVM的文本图像检索

由于图像的底层统计特征与高层语义特征之间存在一道鸿沟,计算机难以直接完成基于语义的文本图像检索.因此,文本图像检索的性能很大程度上依赖于底层统计特征的提取.针对该问

会议

文本图像图像检索图像信息度量支持向量机广义归一化统计特征高层语义特征向量检索技术正确率计算机征之性能网络提取实验鸿沟程度

一种基于局部共现的查询扩展方法

针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC.LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量

会议

一种改进的文本分类方法的研究

文本分类是自然语言处理的一个重要研究方向,它可以有效的解决信息杂乱的现象,并有助于用户发现所需的信息.特征选择和权值函数是文本分类的核心,通过对经典的TF-IDF函数和互

会议

文本分类信息因子特征选择自然语言处理算法研究方向选择方法信息特征实验验证权值函数类间分布证明用户精度经典

基于数据挖掘等技术的半分布式搜索引擎模型

与本文相关的学术论文