论文部分内容阅读
相对互联网搜索引擎,企业搜索引擎用户进行搜索的目的性更强,对搜索结果排序的期望值更高,对同一检索请求希望根据用户的职业背景、兴趣爱好等得到个性化的检索结果。因此,构建一种个性化的排序方法是当前油田领域信息搜索引擎最迫切的需求。本文研究了个性化服务及搜索引擎排序的相关理论和技术,对油田领域多类型检索结果排序需求进行分析,提出了基于用户兴趣模型的个性化综合排序方法。本文的主要研究内容如下:1.面向个性化排序的油田信息搜索引擎架构的研究。从油田搜索引擎的工作原理入手,研究了搜索引擎个性化处理方面的技术,提出了面向用户兴趣进行个性化排序的油田信息搜索引擎的体系架构。2.研究并建立了油田搜索引擎用户的用户兴趣模型。采用用户主动提交兴趣信息和系统自动提取用户搜索历史与浏览行为信息相结合的方法获取用户兴趣信息,并基于改进的TF-IDF算法计算关键词权重,建立了用户兴趣向量空间模型;考虑了用户对搜索结果反馈度的问题,阐述了基于用户浏览行为和内容动态更新模型的方法和流程。3.提出了基于用户兴趣模型的查询优化方法。提出了根据兴趣模型中用户历史查询和浏览行为计算用户兴趣度,并结合扩展用词在结果文档中权重因素合理选择扩展用词对初始查询进行优化的方法,使得用户查询更加全面和准确。4.为油田信息搜索引擎设计了个性化综合排序方法。研究了通用搜索引擎排序算法,针对它们的缺点问题进行改进,设计了一种基于用户兴趣模型的排序算法;然后分析了油田企业领域多数据类型检索结果的排序需求,为油田信息搜索引擎提出了将数据表结果优先排序,其它文档结果根据用户兴趣模型计算相关度后再进行排序的个性化综合排序方法。最后综合以上研究,阐述了面向个性化排序的油田信息搜索系统的设计和实现,以此验证了本研究能有效地提高油田企业搜索引擎查准率及满足用户的个性化检索需求,具有很大的现实意义和实用价值。