大数据与图书馆管理

来源 :杂文月刊(学术版) | 被引量 : 0次 | 上传用户:magutosh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:大数据影响着社会的方方面面,必将为图书馆管理带来深刻的影响和创造性的变化。文章分析了大数据的特征,图书馆的大数据的主要来源,同时图书馆利用大数据也会面管理临诸多的问题和挑战,图书馆应正确地认识大数据,抓住机遇,提升图书馆的核心竞争力。
  关键词:大数据 图书馆管理 挑战 发展方向
  一、大数据的基本特征
  (一)类型繁多
  数据通常被分为结构化数据、半结构化数据和非结构化数据。相对于传统的以文本为主的结构化数据,网络日志、音频、视频、图片、地理位置信息等半结构化、非结构化数据越来越多。同时,近几年出现的微博、微信等可通过移动互联设备使用的电子交往形式使数据量和数据种类更加复杂化。
  (二)价值不高
  价值密度的高低与数据总量的大小成反比。以社会中常见的监控录像为例,一天的监控记录,有用数据可能仅有一二秒。如何将已有的结构化数据、半结构化数据及非结构化数据进行整合、分析,挖掘出更多有价值的信息,并通过强大的计算能力迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。
  (三)要求高速處理
  这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是生命。
  二、图书馆大数据的主要来源分析
  根据大数据的基本特征,经笔者分析,图书馆知识服务领域的未来大数据的来源主要有RFID射频数据、传感器数据、社交网络和移动互联数据等几个方面。随着图书馆数字技术的不断提高,RFID将不断推广,这将是未来图书馆大数据的主要来源之一;由图书馆中的传感器感知生成的数据,长时间积累后也将产生巨大的数据量;社交网络已广泛应用于社会各个方面,逐步成为人们交往的主要形式,其所产生的数据量远超以往任何一个信息传播媒介,由其生成的数据量是不可估量的;移动互联网及移动互联技术的不断完善,使得图书馆可以灵活获取移动电子设备、人员、资源、用户行为和需求等信息,并对这些信息进行实时分析,从而帮助我们开展有效的智能辅助决策。
  三、大数据对图书馆管理的影响和挑战
  (一)海量数据处理考验图书馆计算能力
  大数据时代背景下,各类数据量迅速增长,数据产生的方式、范围发生前所未有的变化,人们在社会中的各类行为都产生了大量的信息数据,信息数据的组成结构、格式类型、存在形态等都更加复杂。图书馆要对上述复杂的数据进行应用、存储,将具有很强的挑战性,不仅仅涉及云计算、大数量级数据存储等技术问题,还可能促发图书馆服务模式、资源建设模式、管理模式与发展模式的转变。
  (二)数据分析方式转变带来的挑战
  随着图书馆信息化程度的提高,以互联网信息搜索、查询为基础的知识服务逐渐被更多的图书馆所采用。但不管是简单的信息服务,还是结合了信息检索、组织、分析等高级业务服务,都可归纳为就数据而进行的服务。大数据时代背景下要求图书馆不仅需要通过结构化数据了解客户需求,也需要大量的非结构化数据、半结构化数据去挖掘、预测和分析当前和未来的用户需求,社会大众的需求也将随着不断变化的个性化的高满意度服务出现而对图书馆的服务呈现出明确和迫切的需求。
  (三)大数据对图书馆基础设施提出更高的要求
  半结构化及非结构化数据的迅速增加,导致数据存储、计算规模越来越大,其成本急剧上升。很多知识服务机构出于成本的考虑将应用由高端服务器转向中低端硬件构成的大规模计算机集群,从而对支持非结构化数据存储及分析的基础设施提出了很高的要求。
  四、大数据时代图书馆管理发展方向
  (一)探索利用数据分析技术与工具
  对图书馆来说,在大数据时代要想在激烈的市场份额竞争中争得一席之地,避免边缘化,开展必要的大数据分析服务显得必不可少。图书馆开展的大数据分析服务业务,主要可以有以下几种:首先是图书馆自身建设所需的大数据分析。这类分析一般以图书馆的现有数据为对象进行分析,如读者的借阅方式、行为爱好等,是一种对现有资源的分析与挖掘;其次是客户即读者所需的大数据分析。这类分析业务类似于当今图书馆为企业等客户群体所做的信息情报参考、竞争情报分析,但也有着很大的区别,如对于分析对象数据的不同、分析手段的不同、分析目的不同等,这类分析业务所依靠的大量数据可能并非图书馆所拥有,从而成为限制该项业务发展的瓶颈,如何解决此类服务的数据问题是突破该瓶颈的关键。
  (二)重视基础设施建设
  大数据时代,图书馆的核心竞争力不再仅是文献数据信息的竞争,各类形式的海量数据以及对海量数据的分析、挖掘才是今后图书馆之间竞争的核心因素。因此,要跟上大数据的脚步,必须完善信息收集的基础设施建设,加强各类信息资源的收集将成为图书馆资源建设的大方向。图书馆首先要明白“数据即生命”,解决数据存储问题。大数据时代对于图书馆的数据存储量要求极高。早在2007年,沃尔玛就通过对消费者的购物行为等非结构化数据进行分析,创造了“啤酒与尿布”的经典商业案例。这样的经典案例是通过对海量的多类型数据收集和分析得到的。因此,图书馆要掌握读者用户、馆员乃至社会服务群体等的信息,既要有当前通用的数据记录中的个人身份、借阅记录等结构化数据,还要有存储信息行为、搜索方式、行为痕迹等非传统数据,这些都需要通过基础设施的建设来支持。
  (三)提高图书馆服务的智能化程度
  大数据背景下的图书馆服务的智能化程度也将达到一个新的高度。图书馆应用智能化技术进行自动的高级、复杂的数据收集及处理工作,既能在一定程度上节省大量的人力物力,也能解决人工可能无法实现的工作需求,如对海量信息数据的智能抓取、关键词抽取等,使得节省下来的大量人力去研究图书馆建设的策略与更进一步的智能化投入。其次,从读者来看,服务内容、手段的智能化程度提高与智能化技术、工具、平台的服务实践,所需的图片、视频、文本等信息将能轻易获取,个体的信息如社交信息、生活数据等大量的非结构、半结构化数据也都能为图书馆的智能化决策提供分析参考。再次,从智能化服务中的知识流通来看,图书馆服务智能化程度的提高不但有利于知识从单个主体拥有向多个主体拥有的流通与传播,更利于隐性知识向显性知识的转变,也有利于知识的发现、挖掘与组织。
其他文献
目的:探讨血清前列腺特异性抗原(PSA)系列及穿刺组织活检Gleason评分在前列腺癌病理分期的预测价值。方法:回顾性分析我院1999~2008年病理证实为前列腺腺癌的124例患者资料,将
氨氮是水体中主要的污染物之一,是引起水质恶化、导致养殖水体中水生动物大量死亡的主要原因。生物脱氮法是被公认为更经济、有效、对环境影响小的方法,也是最有发展前途的污
目的探讨家庭医生服务式健康教育干预在提高社区2型糖尿病患者治疗效果中的作用,为社区健康教育干预提供可靠依据。方法选取东莞市企石镇人民路社区卫生服务站2015年6月至201
云南省边境旅游涉及众多利益主体,每个利益主体的利益诉求各有不同,这就导致各利益主体存在着或矛盾或共生的关系,建立边境旅游协同管理机制可以缓解各利益主体的矛盾冲突,促
目的探讨影响体检护理质量的相关因素及解决对策。方法回顾分析2013年5月-2014年5月我院体检中心的相关护理资料,调查影响体检护理质量的相关因素,并提出改进策略。结果影响
以当代医学模式转变为背景,以麦克莱兰(David C.McClland)等人的职业胜任特征理论和医学教育国际标准为基础,分析了医生职业胜任能力的构成;并基于米勒金字塔模型总结了医生
<正>本刊讯:2月17日,庐阳区专兼职督学金鑫、杨俊一行人到庐阳区青少年校外活动中心对2017年春季开学工作进行了专项督导检查。活动中心党支部书记主任王平、副主任蔡强、教
巴赫金阐释了其自创的时空体理论,并以此为研究方法分析梳理了欧洲小说,总结了时空体的几种主要类型及各自的特征,论述了西方小说的发展脉络和历史演变,明确提出"时空体"理论对
本文针对含Pb2+重金属废水污染严重,危害大的特点,采用来源广泛、价格低廉、吸附能力强的膨润土对其进行处理,主要考察了膨润土微波改性的最佳制备条件以及对含铅废水的最佳
动态目标识别与跟踪是计算机视觉研究的热点问题,为实现汽车辅助驾驶系统中复杂背景下多目标的稳定跟踪,提出了一种基于灰度图像模板匹配的多模式车辆跟踪算法。根据不同模式下