Web信息检索中基于Web挖掘的查询优化研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wzxisno2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索是一门有关信息表示、信息存储、信息组织、信息访问的学科.目前主要采用两个方面的技术,即自动查询扩展技术在线优化与基于用户日志分析的查询结果重新排序的离线优化技术.该文也主要从这两个方面进一步来提高检索的性能,优化检索的结果.该文利用文本挖掘技术来自动构造概念词典,采用文本挖掘的方法挖掘WEB文档集中的词的关联规则.我们将文档集中的文档按照倒排文件建立索引文件,利用文本挖掘技术挖掘文档集合中的词的互现特征,获取词间相关度,并分析词间的关系,以此获得概念词典.然后近可能采用与查询词所有互现的词用来扩展.实验结果显示,基于该方法的概念词典具有动态性、时效性、准确性等特征.我们将构造的概念词典应用到查询扩展中,能明显提高检索的召回率和检索的精度.
其他文献
伴随着物联网时代的到来,越来越多的传感器设备将接入到互联网中,庞大规模的传感器每时每刻产生着大量的数据。为了解决传感器数据高时效性、高吞吐量的问题,结合实时系统与数据
作为辽宁省移动通信公司建设的一个工程项目,大客户移动数据VPN中心是针对大客户的特点向其提供的综合移动数据业务解决方案,利用移动数据业务向大客户提供资源共享的同时,又
语义万维网(Semantic Web)通过为信息定义精确的语义,旨在建立一个机器可以理解和处理的Web。本体(Ontology)作为语义网络的基石,指的是用来描述某一领域知识时所用到的领域内的基
随着互联网的普及,消费观念的改变,在网上开展电子商务的环境已基本成熟,同时各级政府正在积极实施和推动政府上网工程。这些预示着越来越多的应用将构筑在Internet之上,以Web方
计算机网络与多媒体技术的飞速发展,对传统远程通信领域产生了深远的影响,越来越多的多媒体信息出现在Internet上,视频点播(Video on Demand,简称VOD)也随之产生.该文首先介
该论文仔细深入分析了网络体系结构模式Thin-C/S和B/S的特点.提出了用Thin-C/S和B/S混合模式来构建网络财务系统;在网络财务系统的开发模式选择上分析研究了传统的开发模式的
随着实时通信业务的发展,对实时数据的传输质量和可靠性提出越来越高的要求。利用多径传输实时数据可以提高数据传输质量和稳定性,但是现有的多径传输控制协议都是基于文件类
使异构环境下计算机互联,实现资源共享是当今计算机应用领域追求的主要目标之一.分布式对象模型的研究目的在于针对分布式系统特点,运用面向对象方法,实现异构环境下异种机器
随着社会的进步,IT行业的发展越来越快。伴随的问题也越来越多。在数据种类多、数据混乱致使难以管理的情形下,出现了产品数据管理。同时,由于在管理过程中,出现了安全问题,
该文预报系统,适用于全国各级气象预报业务工作.该系统有效地利用了数值损报产品.在先进的计算机设备条件支持下,有效地提高了天气预报的准确率,生成客观化指导预报产品,然后