论文部分内容阅读
图书馆是高校师生的主要知识数据库来源,图书馆内拥有的图书所涉及的领域相当广泛,年年都有源源不断的新书购入量,由此带动馆内的藏书量不断的增加。为此,高校师生们要在海量的书海中找到自己所需要的书籍是成了一件困难的事情。且在实际的借阅书籍的行为过程中,师生借阅的书籍并不一定能代表用户的兴趣爱好,存在一种情况就是借书的人是帮助其他同学借的书,这样的推荐结果就有可能不是师生自己实际需要的,需要另外一种思维来供师生选择。因此,准确而高效的优化存量图书的结构对师生的学习与研究变得相当重要。本文应用聚类算法分析,辅助图书馆的管理人员获取兴趣爱好者形形色色类型书籍的借读频度和喜爱类型,得出借阅频率进行分类的图书借读数据。然后再根据读者的专业背景和兴趣爱好等信息推荐相对应的图书。本文主要采用了基于遗传算法改进后的K-means算法和DBSCAN算法进行实验。主要工作包括:(1)利用遗传算法对经典的K-means算法进行改进,一方面通过对图书馆存储的数据集进行采样,从中找出数据样本集。另一方面通过对数据样本集的分析,提取出用户对应的兴趣爱好、专业背景,从而进行有针对性的书籍推荐。(2)根据不同的需求对DBSCAN算法进行改进,通过对每一个要处理的点对象都进行两次不同的E领域处理,使得聚类算法结果的更加合理性和针对性。最后,依托实验分析获得的相关规律和结论,分别对算法进行改进,针对图书馆存储的数据集进行采样,从中找出数据样本集,通过对数据样本集的分析,提取出用户对应的兴趣爱好、专业背景,从而进行有针对性的书籍推荐。将研究结果应用于数字图书馆的书籍分析及推荐中,在满足用户不同选择的基础上,也同步为数字图书馆的新图书采购、增容以及个性化的定制服务提供有效的数据支撑。