聚类算法在数字图书馆中的应用研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:zhang_250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图书馆是高校师生的主要知识数据库来源,图书馆内拥有的图书所涉及的领域相当广泛,年年都有源源不断的新书购入量,由此带动馆内的藏书量不断的增加。为此,高校师生们要在海量的书海中找到自己所需要的书籍是成了一件困难的事情。且在实际的借阅书籍的行为过程中,师生借阅的书籍并不一定能代表用户的兴趣爱好,存在一种情况就是借书的人是帮助其他同学借的书,这样的推荐结果就有可能不是师生自己实际需要的,需要另外一种思维来供师生选择。因此,准确而高效的优化存量图书的结构对师生的学习与研究变得相当重要。本文应用聚类算法分析,辅助图书馆的管理人员获取兴趣爱好者形形色色类型书籍的借读频度和喜爱类型,得出借阅频率进行分类的图书借读数据。然后再根据读者的专业背景和兴趣爱好等信息推荐相对应的图书。本文主要采用了基于遗传算法改进后的K-means算法和DBSCAN算法进行实验。主要工作包括:(1)利用遗传算法对经典的K-means算法进行改进,一方面通过对图书馆存储的数据集进行采样,从中找出数据样本集。另一方面通过对数据样本集的分析,提取出用户对应的兴趣爱好、专业背景,从而进行有针对性的书籍推荐。(2)根据不同的需求对DBSCAN算法进行改进,通过对每一个要处理的点对象都进行两次不同的E领域处理,使得聚类算法结果的更加合理性和针对性。最后,依托实验分析获得的相关规律和结论,分别对算法进行改进,针对图书馆存储的数据集进行采样,从中找出数据样本集,通过对数据样本集的分析,提取出用户对应的兴趣爱好、专业背景,从而进行有针对性的书籍推荐。将研究结果应用于数字图书馆的书籍分析及推荐中,在满足用户不同选择的基础上,也同步为数字图书馆的新图书采购、增容以及个性化的定制服务提供有效的数据支撑。
其他文献
本文对建国后的新疆油画创作情况做一分析,讨论在新疆油画发展的过程中,油画家面对的一些新出现的艺术现象和问题所进行的思考,对新中国成立以来新疆油画创作现状的整体面貌
日益崛起的中国为何以及如何在印度洋存在不仅是中国自身的一个新兴战略关切,也不可避免地为国际社会所瞩目。国际社会对于中国在印度洋的存在已有视角各异的许多解读。基于
不久以前,在菲律宾参加国际水稻研究所成立二十周年纪念活动的各国农业专家,参观了这里的一项实验:在一块约二亩的水田里,种植有不同条件下生长的同一品种的水稻。其中,长得
笔者通过拉拔试验研究了陶瓷砖吸水率、砖底背纹、砖底粉残留量对陶瓷砖粘结性能的影响。结果表明:吸水率越低,对瓷砖胶粘结力性能要求就越高,细炻砖和陶质砖正常生产工艺,残留下
目的:探讨清热利湿、降糖降浊类中药治疗肥胖型糖尿病的疗效。方法:采用大柴胡汤(柴胡、黄连、黄芩、玄参、枳实、清半夏、茯苓、大黄等)治疗本病39例;并设对照组观察。结果:
要实现中国梦,就必须建设文化强国。而建设社会主义文化强国,就必须走中国特色社会主义文化发展道路。一是要以马克思主义为指导,把握社会主义文化强国的前进方向;二是要增强
人生在世,人人追求幸福。教师是人类灵魂的工程师,是最应该享受工作幸福的人。研究教师的幸福,发现并破译教师幸福的密码,让教师懂得如何了解自己、剖析自己、突破自己,寻求
<正>“九一八”事变后,中国东北沦为了日本帝国主义的殖民地。在它的殖民统治之下,东北的社会形态、社会结构、社会组织、社会关系诸方面都发生了明显的变化,变成了一幅“血
2018年精彩纷呈的美国舞台创作或许可以用"重构"与"融合"来概括。"重构"是对生活的艺术重构,具体表现为经典的重演,原创对当今社会问题的关注。"融合"则是不同表演风格的相互