图书借阅数据的聚类挖掘

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:wangxin3163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大量的数据中提取新颖的、有效的、可信的并被人理解的模式的非平凡过程。而聚类分析则是数据挖掘的一项重要功能。 本文首先简要介绍了数据挖掘的基本理论;接着描述了聚类的含义以及针对不同数据类型的差异度计算;然后列出了数据挖掘中现存的几种有代表性的聚类算法的思想以及它们的优缺点。 在图书馆现有的自动化系统中,每天、每月、每年都会产生大量的统计数据和表单。面对这些海量数据,关键问题是如何将它们合理归类。而聚类分析就是将数据合理归类的一种方法,其目的是把相似的东西归为一类,使得类内具有较大的相似性,而类间具有较小的相似性。 以此为背景,文章着重陈述了在高校图书馆中基于k-means算法的图书聚类。在此部分,首先简要介绍了k-means算法的基本思想;其次在SQL Server数据库中,用SQL查询得出中国海洋大学图书馆中图书的借阅次数、续借次数和平均借阅时间,其中数据是由中国海洋大学图书馆提供的;最后利用k-means算法对图书进行聚类,按图书使用率将图书使用情况分为高、中、低3类,最终得出聚类结果。聚类结果表明,图书馆采购部门应根据现有的图书适当购进一些社会、言情小说,惊险、推理小说,英语读物,英语基本词汇、英语会话图书、英语考试图书,英国短篇小说,散文类图书,计算机程序语言和网络类等图书来满足不同学生读者的需求.聚类结果在一定程度上能够指导图书馆采购部门及时补充图书,以满足读者对图书的需求。
其他文献
随着网络技术的飞速发展,网络安全问题也越来越突出。于是,人们提出了主动的网络安全防御体系——网络监听与入侵检测系统。入侵是任何企图破坏资源的完整性、保密性和可用性的
近年来,随着CAESAR竞赛的举行,使得对认证加密方案的研究达到了一个新的高潮。由于认证加密方案集保密和认证功能于一身的技术优点,其可被广泛应用于既需要加密又需要进行数
在过去的几年,随着无线宽带接入技术飞速发展和无线终端设备迅速普及,无线局域网逐渐成为生活的必需品。人们已不再满足于传统的低速率业务,转而希望得到高吞吐率,高带宽的多
多天线技术能够在不增加天线发送功率及频谱资源的情况下成倍的提高系统容量,是下一代无线通信系统的关键技术之一。通过进一步增加天线阵元的规模,Massive MMO系统又进一步
语音识别的目的是让机器理解人的语言,实现更方便直接的人机交互。经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用。越来越多具有语音识别功能的产品进入人类
现代短波通信中,由于信道大多数具有频率选择性,而且短波频带有限,限制了通信的容量和数据传输的速率。正交频分复用(OFDM, Orthogonal Frequency Division Multiplexing)技
GSM网络经过多年发展,已经比较成熟,具有覆盖面广、用户数量多等优势,并且可以开展多种增值业务,因此GSM通信已经成为移动通信的一个非常重要的方面,得到了通信设备制造商、I
在工业生产中,二次自动化仪表是构成自动化系统的基本单元之一。我国的单元仪表己基本完成由电动Ⅲ型仪表向基于八位或十六位单片机为基础设计的数字化仪表的转换。由于常规
在地震勘探工作中,对地震资料进行反褶积、波阻抗反演、AVO反演以及正演模型的建立这些工作都依赖于高精度的地震子波。而在实际勘探过程中,地震子波常常是未知的,必须通过我