论文部分内容阅读
摘 要 为了提高图书馆平台的服务质量及综合信息搜索能力,引入了数据挖掘技术对大量的图书信息数据流进行分类,同时在结合用户的特征信息和行为模式的基础上,有效地完成用户资源管理及信息数据匹配。从而提高用户信息搜索效率,使用户能够更快地找到更有价值的图书信息。
关键词 数据挖掘 数据库 资源整合 图书馆服务平台
中图分类号:TP274 文献标识码:A
Research and Application on Platform Construction in
the Library Based on Data Mining Technology
WANG Jiao
(Library of Jilin Sport University, Changchun, Jilin 130000)
Abstract In order to improve the quality of library services and integrated information search capabilities of library platform, data mining technology has been introduced. A large number of book information data streams are classified. Meanwhile, with the user on the basis of the characteristics and behavior of the information, effectively complete user resource management and information data match. Thereby increasing the efficiency of the user information searching, enabling users to find information more valuable books faster.
Key words data mining; database; resource integration; library services platform
0 引言
对于图书馆服务平台有多种管理方法,基于大量的信息流存在,不同的数据处理手段影响着平台的性能。目前流行的技术手段是Web数据流控制技术,它能够快速的处理大量的数据资源。对于高等学府的图书馆来说,充分利用网络资源能够给广大师生带来完善的数据信息,对于教育、科研这方面具有重要意义。
整体网络资源的整合需要图书馆中的Web资源平台,包括资源分类、数据挖掘、网络服务、决策处理等的研究。应用高校图书馆服务平台与Web资源相结合,能给高校带来更加完善的信息平台。对于Web资源数据挖掘方式的平台更适应用户的运用,它对科研型、教学型、学习型教师梯队都起到了兼容性。可以为广大师生快速的搜索到对应的信息在图书馆中。因此,数据挖掘技术应用于图书馆是非常实用的,也是国内外大量图书馆服务平台的走向。
1 图书馆服务平台开发的必要性
高等院校应用于数据挖掘技术在图书馆,主要用于人员管理、网上信息服务以及文献信息的管理等方面。传统的图书信息需要专人采集,在一定程度上存在主观因素,因此导致有些学科的分配不合理,从而达不到最佳效果。而采用数据挖掘技术后,可以通过分类、相关计算将资料区分开,把图书馆的资源合理地分配。在信息服务方面,可以为不同的用户提供不同的服务,用户输入检索要求后,一个更全面的数据资源展现在用户眼前。利用数学中的统计分析,粗糙集分类等等数学算法,对借阅者的分析,将借阅者的需求与服务平台相结合,从而更有针对性的提供资源,提高资源的利用。
目前高等院校的图书馆存在孤岛现象,所以需要对服务平台进行改善。由于受到信息化的影响,使得系统、软件、数据库三者之间存在关联性差,导致数据没有稳定的共享性,造成系统效率低下。各个高等院校都存在数字化资源,如果数据能够进行有效的交换,那么拓宽各个高等院校的数字资源是必然。而Web资源共享技术是不可少的,再结合数据挖掘技术,从而达到高效化的图书馆服务平台。这可在短时间内处理大量信息。
2 图书馆研究提取与应用数据挖掘技术概况
数据挖掘是人们从不完全、有噪声、相对模糊、而又随机的大量数据中,提取人们未知的、但又是潜在的信息的过程,它是人们对有价值的知识、或者模型进行规则的过程,是进一步深入分析数据的方法。它根据数据表现出的微观特征,进而发现带有普遍性的知识,由信息优势转化成知识优势的基础。数据挖掘包括多种相关技术,它是一门交叉学科。
自1990年以后,图书馆开始不断关注数据挖掘技术并参与研究,并致力于将数据挖掘技术引入到图书馆,用于现代化建设的图书馆,有关专家提出了其应用理论与方法。比如:有关团队提出了相关性理论模型对于多种学术型图书馆,并且成功开发了来自图书馆网上数据挖掘相关系统,有助于用户查找相关信息。在1998年,有位先生提出了全文本形式的、动态变化的数据库,这更适用于数据挖掘技术。2002年,两位学者提出了书目挖掘这个专业术语对于图书馆中运用数据挖掘技术过程,他们将数据挖掘技术和相关理论与方法结合在一起,从中获取隐含的模式。2005年,联机计算机图书馆中心公布了新的研究计划,其中提及到数据挖掘研究计划,主要为找到隐含的信息和有用的信息,最终帮助图书馆管理人员实现馆藏建设和服务。相对于国外图书馆来说,我国图书馆在数据挖掘技术方面并没有大规模使用,只有少数图书馆采用了数据挖掘技术。但国内图书馆界早已认识到,应用于数据挖掘技术在图书馆的重要性。 3 服务平台中的Web数据挖掘
3.1 数据库的建立
对于数据挖掘技术来说,完整的数据库是必不可少的,这是其应用的基本条件,常用的数据库建立可以将海量的数据信息从某种复杂的环境中提取出来,从而形成一个独立的数据资源体系。传统的数据库与服务平台中的数据库是不同的,后者更注重于系统的集中性、统一性。管理信息的基本单元是数据库,它也是决策系统的组成单元,数据库为决策者提供信息保障,从而根据信息完成决策。所以,一个完善的图书馆服务平台需要建立数据库。各类信息与表一一对应。建立完毕数据库星形模式以后,便可数据聚集了,它可用于分析应用的需求关系,并且数据聚集与事实表和维表有着密切联系。
3.2 Web数据挖掘
Web数据挖掘包括:(1)数据的预存储。要对采集到的数据进行预处理。在Web数据挖掘基础上,所采用的预处理是收集数据资源的信息,从而保证数据的完整性,这在收集过程中不需要消耗更多的时间,结合IP地址信息实现联机采集的效果。(2)对于数据的算法。挖掘可谓是一个长期、动态过程,不同的数据需要不同的处理算法。例如有滑动窗口模型、特征时间模型等等。利用多种相关算法对资源进行整合,再将近似的、相关联的数据提取出来。(3)模式的构建。模式的自组织需要通过分类、聚类以及关联的方法。分类模型可以实现分类,获取类别信息就要利用分类函数,并分析其公共属性,通过类型特征还可以进行聚类。用户可通过关联规则完成网站上的资源相互关系,从而挖掘出用户的阅读需求,来实现服务的高级功能。(4)整合资源信息。由于Web存在信息的多样性、广泛性,这就需要合理的导航和检索能力,资源的有效定位需要通过资源的发现、分类等功能来完成。
4 结论
本文采用Web数据挖掘技术,利用这种技术设计了一种更加有利于读者获取信息的工作模式。系统通过分类分析,将相应数据进行一系列处理,通过此种方式构建了上述文中基于Web数据挖掘技术的图书馆服务平台。数据挖掘的基础是数据库,完成数据收集、处理以及存储等工作基础上,其还实现了知识特征提取,从而达到图书馆服务平台大幅度的提升,更能够在图书馆充分发挥数据信息的能力。
参考文献
[1] 姚玉阁.浅析数据挖掘技术[J].信息与电脑,2010(11):115.
[2] 周倩.复合图书馆信息资源管理研究.图书情报知识,2003(5).
[3] 杨中华.数据挖掘在客户关系管理中的应用研究.湖北汽车工业学院学报,2004(1).
关键词 数据挖掘 数据库 资源整合 图书馆服务平台
中图分类号:TP274 文献标识码:A
Research and Application on Platform Construction in
the Library Based on Data Mining Technology
WANG Jiao
(Library of Jilin Sport University, Changchun, Jilin 130000)
Abstract In order to improve the quality of library services and integrated information search capabilities of library platform, data mining technology has been introduced. A large number of book information data streams are classified. Meanwhile, with the user on the basis of the characteristics and behavior of the information, effectively complete user resource management and information data match. Thereby increasing the efficiency of the user information searching, enabling users to find information more valuable books faster.
Key words data mining; database; resource integration; library services platform
0 引言
对于图书馆服务平台有多种管理方法,基于大量的信息流存在,不同的数据处理手段影响着平台的性能。目前流行的技术手段是Web数据流控制技术,它能够快速的处理大量的数据资源。对于高等学府的图书馆来说,充分利用网络资源能够给广大师生带来完善的数据信息,对于教育、科研这方面具有重要意义。
整体网络资源的整合需要图书馆中的Web资源平台,包括资源分类、数据挖掘、网络服务、决策处理等的研究。应用高校图书馆服务平台与Web资源相结合,能给高校带来更加完善的信息平台。对于Web资源数据挖掘方式的平台更适应用户的运用,它对科研型、教学型、学习型教师梯队都起到了兼容性。可以为广大师生快速的搜索到对应的信息在图书馆中。因此,数据挖掘技术应用于图书馆是非常实用的,也是国内外大量图书馆服务平台的走向。
1 图书馆服务平台开发的必要性
高等院校应用于数据挖掘技术在图书馆,主要用于人员管理、网上信息服务以及文献信息的管理等方面。传统的图书信息需要专人采集,在一定程度上存在主观因素,因此导致有些学科的分配不合理,从而达不到最佳效果。而采用数据挖掘技术后,可以通过分类、相关计算将资料区分开,把图书馆的资源合理地分配。在信息服务方面,可以为不同的用户提供不同的服务,用户输入检索要求后,一个更全面的数据资源展现在用户眼前。利用数学中的统计分析,粗糙集分类等等数学算法,对借阅者的分析,将借阅者的需求与服务平台相结合,从而更有针对性的提供资源,提高资源的利用。
目前高等院校的图书馆存在孤岛现象,所以需要对服务平台进行改善。由于受到信息化的影响,使得系统、软件、数据库三者之间存在关联性差,导致数据没有稳定的共享性,造成系统效率低下。各个高等院校都存在数字化资源,如果数据能够进行有效的交换,那么拓宽各个高等院校的数字资源是必然。而Web资源共享技术是不可少的,再结合数据挖掘技术,从而达到高效化的图书馆服务平台。这可在短时间内处理大量信息。
2 图书馆研究提取与应用数据挖掘技术概况
数据挖掘是人们从不完全、有噪声、相对模糊、而又随机的大量数据中,提取人们未知的、但又是潜在的信息的过程,它是人们对有价值的知识、或者模型进行规则的过程,是进一步深入分析数据的方法。它根据数据表现出的微观特征,进而发现带有普遍性的知识,由信息优势转化成知识优势的基础。数据挖掘包括多种相关技术,它是一门交叉学科。
自1990年以后,图书馆开始不断关注数据挖掘技术并参与研究,并致力于将数据挖掘技术引入到图书馆,用于现代化建设的图书馆,有关专家提出了其应用理论与方法。比如:有关团队提出了相关性理论模型对于多种学术型图书馆,并且成功开发了来自图书馆网上数据挖掘相关系统,有助于用户查找相关信息。在1998年,有位先生提出了全文本形式的、动态变化的数据库,这更适用于数据挖掘技术。2002年,两位学者提出了书目挖掘这个专业术语对于图书馆中运用数据挖掘技术过程,他们将数据挖掘技术和相关理论与方法结合在一起,从中获取隐含的模式。2005年,联机计算机图书馆中心公布了新的研究计划,其中提及到数据挖掘研究计划,主要为找到隐含的信息和有用的信息,最终帮助图书馆管理人员实现馆藏建设和服务。相对于国外图书馆来说,我国图书馆在数据挖掘技术方面并没有大规模使用,只有少数图书馆采用了数据挖掘技术。但国内图书馆界早已认识到,应用于数据挖掘技术在图书馆的重要性。 3 服务平台中的Web数据挖掘
3.1 数据库的建立
对于数据挖掘技术来说,完整的数据库是必不可少的,这是其应用的基本条件,常用的数据库建立可以将海量的数据信息从某种复杂的环境中提取出来,从而形成一个独立的数据资源体系。传统的数据库与服务平台中的数据库是不同的,后者更注重于系统的集中性、统一性。管理信息的基本单元是数据库,它也是决策系统的组成单元,数据库为决策者提供信息保障,从而根据信息完成决策。所以,一个完善的图书馆服务平台需要建立数据库。各类信息与表一一对应。建立完毕数据库星形模式以后,便可数据聚集了,它可用于分析应用的需求关系,并且数据聚集与事实表和维表有着密切联系。
3.2 Web数据挖掘
Web数据挖掘包括:(1)数据的预存储。要对采集到的数据进行预处理。在Web数据挖掘基础上,所采用的预处理是收集数据资源的信息,从而保证数据的完整性,这在收集过程中不需要消耗更多的时间,结合IP地址信息实现联机采集的效果。(2)对于数据的算法。挖掘可谓是一个长期、动态过程,不同的数据需要不同的处理算法。例如有滑动窗口模型、特征时间模型等等。利用多种相关算法对资源进行整合,再将近似的、相关联的数据提取出来。(3)模式的构建。模式的自组织需要通过分类、聚类以及关联的方法。分类模型可以实现分类,获取类别信息就要利用分类函数,并分析其公共属性,通过类型特征还可以进行聚类。用户可通过关联规则完成网站上的资源相互关系,从而挖掘出用户的阅读需求,来实现服务的高级功能。(4)整合资源信息。由于Web存在信息的多样性、广泛性,这就需要合理的导航和检索能力,资源的有效定位需要通过资源的发现、分类等功能来完成。
4 结论
本文采用Web数据挖掘技术,利用这种技术设计了一种更加有利于读者获取信息的工作模式。系统通过分类分析,将相应数据进行一系列处理,通过此种方式构建了上述文中基于Web数据挖掘技术的图书馆服务平台。数据挖掘的基础是数据库,完成数据收集、处理以及存储等工作基础上,其还实现了知识特征提取,从而达到图书馆服务平台大幅度的提升,更能够在图书馆充分发挥数据信息的能力。
参考文献
[1] 姚玉阁.浅析数据挖掘技术[J].信息与电脑,2010(11):115.
[2] 周倩.复合图书馆信息资源管理研究.图书情报知识,2003(5).
[3] 杨中华.数据挖掘在客户关系管理中的应用研究.湖北汽车工业学院学报,2004(1).