论文部分内容阅读
图书资源在世界范围内广泛分布,它们与人类的生活息息相关,书籍是社会进步和人类文明的标志之一,是促进社会政治、经济、文化发展必不可少的重要传播工具。对于读者来说,如何在海量的图书网络资源中搜索自己所需的内容,成为一个重要的课题。针对这一现象需求,本文实现了一个图书网络资源的垂直搜索引擎系统,并在其基础上完成推荐系统功能,使用户可以方便的找到自己感兴趣的内容。为实现目标,本文的研究步骤如下。首先通过前期人工调研的方式确定数据源网站;其次实现基于主题相关度的网络爬虫程序,对数据源网站进行采集和存储;最后,根据主题相关度,关键字匹配和基于用户行为、书籍信息的推荐算法相结合的方法对检索结果进行排序返回检索结果。采用以上的研究步骤,本文取得了以下成果:1、用户注册模块挑选几类书籍给用户选择喜好,解决推荐系统的冷启动问题。2、垂直搜索引擎检索结果的排序算法,不只是依赖于关键字的匹配,还利用到了用户的历史行为信息;3、检索结果不是单一的书籍列表,而是由历史记录推荐列表和检索关键字推荐列表组成。综上所述,本文在技术创新的基础上,为读者提供了一个更方便、快捷,可以根据读者的口味推荐合适的书籍的图书搜索平台。