数智时代高校图书馆面向新文科的学科数据服务研究

来源 :图书与情报 | 被引量 : 0次 | 上传用户:kenapple1368
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘   要:面对新文科建设需求,高校图书馆需要主动进行服务创新来回应数智时代新文科建设的呼唤,承担起新时期高校图书馆的新使命。文章梳理了学科服务到学科数据服务的发展演进过程,并依据数据生命周期理论构建了“大数据+小数据”的学科数据服务模式,进而提出相应的实施策略。文章认为,数智时代的高校图书馆要树立大数据思维理念,根据新文科建设需求重塑图书馆学科服务模式,提供高效、精准、专业的学科数据服务,全面提高学科数据服务的服务层次和质量。
  关键词:数智时代;高校图书馆;新文科建设;数据服务
  中图分类号:G258.6   文献标识码:A   DOI:10.11968/tsyqb.1003-6938.2021063
  Research on Subject Data Service of University Library Facing the Construction of New Liberal Arts in the Era of Digital Wisdom
  Abstract Facing the needs of new liberal arts construction, university libraries need to actively carry out service innovations to respond to the call for new liberal arts construction, and undertake the new mission of university libraries in the era of digital intelligence. The article sorts out the development and evolution process from subject services to subject data services, and constructs a "big data + small data" subject data service model based on the data life cycle theory, and then proposes corresponding implementation strategies. The article believes that university libraries in the era of digital intelligence should establish the concept of big data thinking, reshape the library subject service model according to the needs of new liberal arts construction, provide efficient, accurate, and professional subject data services, and comprehensively improve the service level and quality of subject data services.
  Key words era of digital wisdom; university library; construction of new liberal arts; data service
  云计算、大数据、人工智能等新一代信息技术的飞速发展,在全面推进科技创新和产业革命的同时,对人们生活、生产与学习产生了巨大影响,世界已进入“数智”时代。数智时代就是以大数据和人工智能为代表的数据思维和技术应用的深度融合,这些思维与技术深刻地影响着人类的思维习惯、工作方式和生活状态。大数据作为人工智能的基础,又推动着人工智能的应用,带动其他相关新技术不断发展,形成新的“数智”技术体系与应用。这种“数”的规模扩张和“智”的深度升级,“数”和“智”全方位结合形成“數智”时代的典型特征。“数智”理念与技术的发展为高校“双一流”与新文科建设提供了重要支撑。尤其是新文科建设亟需突破传统文科思维模式,利用新一代信息技术赋能、数据赋能,从而实现跨学科的深度融合,进而推动文科建设的转型升级。新时代催生新文科建设,新文科建设呼唤高校图书馆必须以新姿态新方法创新新服务。高校图书馆也要主动回应新文科建设的呼唤,转变传统的资源观、服务观,以技术和数据赋能新文科建设,构建数智时代的新型学科服务模式,以现代信息新技术赋能文科教育,为实现新文科建设目标发挥应有责任和担当。本文依据数据生命周期理论,尝试构建了“大数据+小数据”、“技术”+“数据”+“资源”融合赋能的新文科建设学科数据服务模式,为面向新文科建设,树立新理念、采用新方法、利用新技术的学科服务研究起抛砖引玉作用。
  1   从学科服务到学科数据服务的发展与演进
  学科服务是高校图书馆为适应新的信息环境,以满足学科用户需求为目标,按照学科、项目、专业等的科学研究来采集、检索、组织、利用信息资源,提高用户对信息服务需求的满意度和任务支持力度的一种新型的服务模式[1]。在国内于1998 年由清华大学率先提出并实施以来,图书馆业界对其进行了持续的实践探索,学科服务也成为了新世纪以来我国图书馆特别是高校图书馆和专业图书馆从传统向现代转型变革的里程碑[2]。
  从我国图书馆学界所展开的学科服务理论研究可以看出,在学科服务提出之后的前20年中,相关研究主要以传统的学科服务体系建设为主,中国科学院国家科学图书馆等机构实施的全新学科化服务模式与机制,则将学科服务提升到了嵌入式学科服务发展水平。随着2015年以来移动互联网的飞速发展与移动智能终端的广泛应用,学科服务逐渐向移动化、智能化、个性化方向发展[3],相关研究开始向有关“双一流”“大数据”“人工智能”“数据服务”等特色学科服务方向转型。其中,“数据服务”本质上就是学科数据服务的一种形式,其中数据馆员由学科馆员兼任,是对学科馆员能力要求的进一步延伸。2018 年 4 月 3 日,我国首届《全国高校数据创新研究大赛》中展示“数据分析驱动科研创新重要性”参赛作品[4]也启示图书馆:数据服务将是高校图书馆学科服务的延伸,学科数据服务是高校图书馆学科服务的新的生长点。   根據学科服务科学研究的发展及态势可以发现,数智时代的到来让图书馆的学科服务发生了较大变化,将学科数据作为一种资源,利用大数据、云计算等技术分析和组织数据资源,并利用数据挖掘实现技术增值,通过聚类和关联将交叉学科中的数据采集和过滤,进而根据用户个性化需求提供相应的服务成为了学科服务发展的方向。可以预见,随着《新文科建设宣言》的发布和新文科建设的正式启动,传统学科服务内容已无法满足新文科建设的要求,在数智理念的引导下转型升级学科服务,利用新技术革命转型升级的契机,借鉴其他相关领域的理论,探索面向新文科建设的学科数据服务既是高校图书馆在新时代的新使命,也将是数智时代图书馆学科服务面向新文科建设的新方向[5]。
  2   面向新文科建设的学科数据服务模式设计
  数智时代,新文科建设亟需进行学科交叉融合的探索,图书馆要深刻把握各类用户对于文献、数据、信息与知识资源等方面的新需求,通过大数据分析预测学科未来需求趋向,树立新的资源观,不断进行资源优化;通过小数据分析用户多元化、个性化需求,满足新文科建设对图书馆学科数据服务提出的新要求。基于此,本文所设计的面向新文科建设的学科数据服务主要从两方面开展:一是基于大数据的新文科学科数据发展趋向预测,通过大数据挖掘分析,获得更多新的知识,从资源供给角度优化用户体验;二是基于小数据的多元化、个性化用户学科服务产品定制,从用户与资源匹配角度提供分类、分层、精准服务。
  2.1    模式设计理念
  (1)树立“数智”思维理念,创新数据资源观。树立“数智”思维理念,实现“从样本到全体”“从精准到繁杂”“从因果到关联”的数据思维转变。积极参与新文科大数据建设,采用灵活的形式,以数据共同体取代固定的单位。在数据标准管理上,构建灵活的、可扩展的元数据体系,增强数据共享的可能性;在建设内容上,创新固有数据资源观,除已有结构化的文献资源、数字资源外,加强对多源多类型的海量半结构化、非结构化数据的收集、整理、分析、利用和共享[6]。从凌乱、繁杂、多源、异构的数据中,清洗出关系到事物根本性的认识;从对大量、模糊、动态变化、多类型数据的深度分析中,挖掘有价值的信息,掌握和预测新文科数据建设未来发展的最大可能,或者从深度挖掘中发现异样,从而引起关注,做出预警推测[7]。
  (2)“技术”+“数据”+“资源”融合驱动新文科建设。新文科的“新”主要体现在学科协同之新、信息技术融入之新、人才培养模式之新等方面[8]。数智时代的到来,图书馆从技术赋能(Technology Empowerment,TE)到数据赋能(Data Empowerment,DE),推动着学科服务从文献服务向数据服务转型。凭借“技术”+“数据”+“资源”先天优势承担起数智时代新文科建设的新任务,重塑文科思维方式,实现传统科研范式向数据密集型科研范式转型。创新新文科建设的学科数据服务,形成可推广、可移植的学科数据服务模式,提升面向新文科建设的学科服务能力和服务水平。
  2.2    模式框架构建设计
  数据生命周期是指从数据产生开始,经过对数据的收集、加工、分析、存储、访问和共享,最终实现数据再利用的循环过程。依据数据生命周期理论将面向新文科建设的“学科大数据+用户小数据”服务模式分为四个层次:第一层为数据采集层;第二层为数据管理层;第三层为数据分析层;第四层为数据挖掘层(见图1)。
  (1)数据采集层。数据采集是基础,是数据开发和利用的前提条件。在此层面,可根据 5W原则,利用监控器、传感器等智能传感设备实现数据采集与计算,并通过 Flume、Hadoo及 Spark集群技术将其进行有效存储与分析。全面采集新文科建设相关数据资源,包括馆藏资源、联盟资源、特色资源、业务数据、云资源库、机构库等资源数据,同时采集用户特征数据、行为数据、社交数据,并依据数据资源描述标准对相关数据进行有序化组织,使之有序、可用。通过各类数据的有序化过程形成粗粒度知识,为下一步知识组织的粗粒度知识细化提供数据来源,实现知识融合的底层数据准备[9]。在此层面,图书馆将资源数据与用户数据进行有效关联,进行数据参考咨询、学科导航、文献检索等传统的学科服务。
  (2)数据管理层。数据采集不是目的,让采集来的数据产生价值才是最终目的。从海量、复杂、多种类型和结构的数据中提取对新文科建设和学科数据服务有重要价值的数据,并组织整理存储到用HDFS 技术建立的数据库中。与此同时,利用分离数据库架构和分离表架构等数据清洗技术删除与学科数据服务无关的数据或信息,并全面提高数据安全性、隔离性和灾难备份可控性,提升数据价值密度[10],从而实现学科数据服务与用户需求的无缝对接并获得对服务意见的及时反馈。
  (3)数据分析层。数据分析主要包括两个方面:一方面是图书馆相关学科大数据分析。 对图书馆的现有相关数据对象进行分析,在海量数据中提取和分析新文科建设相关数据,经过粗粒度知识描述和细粒度知识组织等环节,重组传统文科数据资源,实现跨学科融合发展,使其在新文科建设过程中产生新价值;另一方面用户小数据分析。通过Spark 集群进行数据的高效分析计算,利用算法预测新文科建设用户的服务需求,深入挖掘用户深层次服务需求,将用户需求与新文科建设专业学科数据资源进行有效匹配,并向用户提供个性化、精准化的知识推荐服务,从而满足用户个性化服务需求。此外,大数据智能可视化技术是“数智”时代图书馆面对海量复杂数据的有效分析方法之一,其实质是从证实性数据分析到探索性数据分析的跨越。强调的不仅是数据量的巨大增长,还隐藏着海量非结构化数据间关联性、交互性关系的可视化[11]。总之,数据分析要有足够的用户意识,学科数据服务在大数据分析与挖掘中首先要让数据与用户关联起来,其次要让“休眠数据”活起来,把高价值的知识挖掘出来。   (4)数据挖掘层。数据挖掘是指从海量数据中挖掘出隐含的,先前未知的并有潜在价值的信息的非平凡过程。数据挖掘可以与用户或知识库交互,将用户与知识库进行有效关联,为用户提供精准学科数据服务。其任务有关联分析、分类分析、聚类分析、异常分析、特异群组分析和演变分析等[12]。图书馆拥有大量的学科数据资源,新文科建设迫切需要将这些数据资源转换成对新文科建设有更大价值的学科数据。这就要求学科数据服务使用 Hadoop 的 Mahout 等数据挖掘技术,通过K-Means聚类、SVM统计学习、NaiveBayes分类等算法挖掘、识别、组织与分析数据,对学科前沿和研究热点进行预测分析,为新文科建设提供个性化、精准化的知识服务,为用户提供持续准确的学科数据支持,并准确预测用户的知识服务需求,进而提供多元化、个性化定制产品[13]。同时,可通过深度学习、机器学习、数据挖掘、聚类、关联分析和回归分析等技术提取用户属性特征,利用用户偏好与行为数据,深入挖掘其潜在服务需求并构建用户画像,进行用户行为预测,分析数据关联关系和用户需求等之间的关联关系,最终实现新文科建设学科数据精准定制服务。
  2.3    模式實施策略
  2.3.1   加强数据素养教育,提升面向新文科建设的服务能力
  数据素养是指在充分关注数据管理与分析的基础上,组织、定位、创建和评估信息和数据的能力,是信息素养的核心组成部分[14]。高校图书馆数据素养是人才培养的核心。要从数据意识、数据能力、数据伦理三个层次有意识地培养新文科研究者、建设者与学生的数据素养。发挥学科服务的纽带作用,为新文科的建设与未来研究“赋能”。如武汉大学、南京大学、中山大学、北京大学等先后推出类似《信息素养》《数据素养》等课程,为我们提供了很好的借鉴。高校图书馆在面向新文科建设的新环境,要发挥自己在数据素养教育、 学术规范训练等方面的优势,开展数据素养通识教育、学术沙龙、展览体验等活动或服务来拓宽新文科学生的视野,丰富他们的知识结构,推进数据素养教育。同时,高校图书馆要积极尝试拓展信息素养教育模式,利用MOOC、微信等平台开展虚拟课堂教学,在线为用户提供自主学习数据库知识和信息检索技巧的教育途径[15]。
  2.3.2   建设学科数据服务空间,为新文科建设赋能
  学科数据服务离不开学科研讨空间、跨学科协作空间、虚拟仿真空间等一套完整的空间服务设施的支持。特别是新文科建设的提出,为技术赋能、数据赋能新文科而打造的新文科实验室,为跨学科融合发展提供了“文+文”“文+理”“文+信息技术”的交流、共享、互动的线上线下全媒体学科数据服务空间。如上海交通大学图书馆首创了IC2服务模式,将信息共享空间(Information Commons,IC)和创新社区(InnovationCommunity,IC)相结合,强化学术创新支持与人文素养拓展,努力提升图书馆服务效能[15]。将网上 IC 移植到物理 IC 可使学习空间与学科服务更好地融合,促进学科服务与用户的学习研究更加密切地结合在一起,形成一种开放的泛在服务体系。
  2.3.3   加快学科数据服务平台建设
  新文科建设的学科交叉融合急需一个能横跨各学科知识体系提供交流合作的数据服务平台。图书馆可作为学科交叉的交融点,将新文科建设研究者信息、各类研究数据与资源、研究成果等进行组织、存储、整合,为学科用户提供一个资源无缝链接、功能强大的一站式学科信息服务平台。为新文科建设搭建一个传输学科数据资源,开展学科数据服务,促进跨学科的交流、协作、分享的创意平台。如重庆大学图书馆建设的“智慧型资源门户”将纸质文献元数据与数字文献元数据整合在一起,实现纸质文献和数字文献的聚类,为不同学科的师生提供个性化的知识推送服务,让不同学科读者拥有专属的资源门户。这无疑是学科资源建设与学科服务进一步融合的方向[16]。
  当前,新文科建设中风头最强劲、发展最迅猛、成就最显著,也最被看好的当属数智人文“Digital-Intelligent Humanities (DIH)”[17]。其为新文科提供了跨学科交流平台和新的研究工具,激发了新的研究方法、研究范式和研究活力,推动了学术机制的重组(构)和再造。如计算社会科学就是旨在打造“数智人文”、用计算手段来研究社会科学的一门交叉学科[18]。目前,北京大学、武汉大学、复旦大学、华东师范大学等高校都建立了人文科学大数据平台。南京大学能源科学研究院、全球能源科学信息中心更是学科数据服务平台建设的典范。
  3   结语
  数智时代,图书馆学科服务进入新时期。面向新文科建设,高校图书馆要迎接新挑战,树立新理念,重建新资源,重构新服务。要抓住新文科建设契机,凭借自身“技术”+“数据”+“资源”的优势,创新学科数据服务模式,服务新文科建设,促进跨学科融合发展,实现向第四次科研范式“数据密集型科学发现(Data-Intensive Scientific Discovery)”的转型。
  参考文献:
  [1]  罗秀娟.学科信息共享空间2.0服务模式的构建[J].图书与情报,2013(3):94-97.
  [2]  赵梅.同伴教育:高校图书馆嵌入研究生学科服务新模式[J].图书馆学研究, 2017(4):85-89.
  [3]  张向先,郭顺利,李昆.新媒体环境下高校图书馆学科服务团队知识共享机理分析[J]. 图书馆建设,2017(5): 79-86.
  [4]  首届全国高校数据驱动创新研究大赛在北大举行[EB/OL].[2021-04-06].http://pkunews.pku.edu.cn/xwzh/2018-04/06/content_301808.htm.   [5]  邵波,单轸,王怡. 新一代服务平台环境下的智慧图书馆建设:业务重组与数据管理[J].中国图书馆学报,2020,46(2): 27-37.
  [6]  杨艳红,王昆仑.思维嬗变引领信息服务创新与发展[J].情报理论与实践,2014,37(12): 53-56.
  [7]  维克托·迈尔-舍恩伯格,肯尼思·库克耶.盛杨燕,周涛,译.大数据时代[M].杭州: 浙江人民出版社,2013:27-94.
  [8]  “新文科”的来源、特性及建设路径[EB/OL].[2021-05-20].http://www.cssn.cn/kxk/202009/t20200911_5181760.shtml.
  [9]  杨昭.大数据时代高校图书馆世界一流学科评价服务研究[J].图书与情报,2018(5):81-86.
  [10]  董同强,马秀峰.“人工智能+图书馆”视域下智慧型学科服务空间的构建[J].图书馆学研究,2019(2):83-88,46.
  [11]  张宸,吴廷照,戴平等.大数据智能可视化在北美高校图书馆的应用研究[J].图书馆建设,2017(8):69-73.
  [12]  刘凡.数据如水-漫谈统计推断、数据挖掘和大数据[J].调研世界,2014(3):57-58.
  [13]  王丹.大数据影响图书馆服务与发展趋势的调查研究[J].图书馆工作与研究, 2017(6):76-80.
  [14]  Schield M.Information Literacy,Statistical Literacy and Data Literacy[EB/OL].[2021-05-02].http://www.iassistdata,org/downloads/iqvol282- 3shields.pdf.
  [15]  劉妍,王天泥.“双一流”背景下高校图书馆智慧化学科服务研究[J].图书馆工作与研究,2019(10):5-10.
  [16]  肖希明,尹彦力.服务于“双一流”建设的高校图书馆信息资源建设[J].图书馆建设,2018(4):79-84.
  [17]  新文科建设:“新”从何来,通往何方[EB/OL].[2021-05-06].http://theory.people.com.cn/n1/2021/0320/c40531-32056287.html.
  [18]  徐飞:新文科与创新创业[EB/OL].[2021-05-20].http://www.ahskj.org.cn/system/2021/01/15/011848022.shtml.
  作者简介:郑金萍,女,太原师范学院图书馆副研究馆员,研究方向:图书馆学教育,数字图书馆,学科数据服务。
其他文献
促进学生深度参与一直是在线教学质量提升研究领域的重点论题。文章在《教育传播学》课程“教育传播环境”专题在线教学中引入BOPPPS参与式教学模型,基于学生自评数据分析学习满意度及相关影响因素。研究结果表明,三个学习目标达成满意度高且相互之间存在显著正向相关关系;学生对讨论话题、工具、过程与结果的满意度高,四者之间多存在显著正向相关关系;学生对讨论工具、过程与结果的满意度与其对低阶目标与高阶目标的达成满意度之间存在显著正向相关关系。文章同时分析了学习满意度的影响因素,并在此基础上提出了在线参与式教学的优化
人们不会忘记那场创造了人类战争史上奇迹同时也创造了伟大的抗美援朝精神的战争,人们不会忘记那场伟大战争中的每一位英雄.在上甘岭战役中,中国人民志愿军中涌现出了无数感天动地的英雄人物.可由于各种原因,一些英雄隐功埋名数十载,一些英雄的事迹惊天地、泣鬼神,其英名却并不为人熟知.反映志愿军抗美援朝出国作战的电影《英雄儿女》至今仍影响广泛,这部电影的主人公王成的原型之一,就是在中国人民志愿军抗美援朝出国作战中荣立特等功,获得“一级战斗英雄”称号,被朝鲜民主主义人民共和国最高人民会议追授“朝鲜民主主义人民共和国英雄”
期刊
作为情感的媒介,“摆宴”这一传统习俗在传统生活中扮演着极其重要的角色,是人们进行情感性表达的重要工具和载体,起着情感维系纽带和群体归属等的作用。  在国人的传统意识中,婚丧嫁娶都是人生中的大事,免不了请客吃饭,常常伴随着的就是大操大办。西汉开国功臣周勃早年就“常为人吹箫给丧事”,看吧,即使在民不聊生的秦朝末年,遇到白事,百姓都还是要想办法整得隆重点。六朝时, 遇到大事,还会请一些名士来席上唱唱歌,
期刊
匠心,是穿越千年的传世珍宝。它不仅属于工匠这一群体,更是我们每个人所共有的精神财富。在这个浮躁的时代,匠心的价值更为凸显。
期刊
文章从乡村振兴背景下人民日益增长的美好生活需要出发,结合服务设计思维进行公共文化智慧服务设计研究,从理念、维度、要素、层次、价值五个方面展开用户参与式公共文化服务设计分析,提出了创新服务设计理念、拓展服务设计维度、优化服务设计要素、细分服务设计层次、发挥服务设计价值的用户参与式公共文化服务设计方法,旨在通过用户参与式服务设计提升乡村公共文化服务效能,结合人工智能等新技术优化公共文化服务用户体验。
古籍文献是图书馆馆藏文献的重要组成部分,然而对其开发利用仍存在着诸多困难。文章从“中华古籍保护计划”入手,针对图书馆古籍保护现状,提出图书馆古籍保护和开发利用途径。
欧美科学数据政策概览及启示  马 合 黃小平  (1.株洲市图书馆 湖南株洲 412000)  摘 要:随着数据密集型科研范式时代的到来,科学数据已成为全球科学系统基础设施的重要组成部分,是经济社会发展的重要战略资源和国家科技创新和竞争的重要制高点。为在科技竞争中保持优势,世界各国尤其是欧美发达国家纷纷布局,出台了一系列科学数据管理相关政策、法规和指南,意图发挥科学数据在不同领域的重要作用,推动本
摘 要:弹幕作为社交网站中的一种新型交互方式,让用户在观看视频内容的同时实现实时交互,因而受到了信息行为研究者的关注。为了探讨弹幕是否能够反映用户的情感体验及情感体验的改变,文章采用基于情感词典的文本分析方法,通过情感词的语义加权来获取弹幕情感值及情感类别,构建视频要素词典将带有情感倾向的弹幕归类,分析弹幕所反映的用户情感体验类型和趋势变化。研究发现通过该方法可以判斷用户情感体验的分类,从情感立场
摘 要:大数据环境促使情报信息变得日益复杂,建立起科学合理的科技智库情报信息共享体系,对为科研与政府决策提供优质且便捷的服务具有重要意义。文章基于大数据背景下科技智库的现实需求,首先,从智库类别与演化过程、科技智库的基础职能与地位等方面对科技智库的内容进行了解析;其次,结合国内外科技智库发展现状,典型科技智库建设情况以及科技智库信息共享内容和模式,指明我国科技智库情报信息共享体系现存问题及机遇,并
文章基于知识产权双重属性(具象技术资源属性和抽象权利属性)和创新活动范畴(单次创新活动和创新循环系统)的理论认识,探究知识产权对创新发展的驱动机制,以期为知识产权政策优化、评估、应用提供理论依据和新思路。采用扎根理论的研究方法,通过对粤港澳大湾区100份知识产权政策文本的分析挖掘,提取和凝练知识产权驱动创新发展的理论模型。研究发现,知识产权驱动创新发展体现在两个层面,一是通过知识产权保护、知识产权管理、知识产权运用来保障、促进知识产权经济价值、技术价值、信息价值的实现,进而促进创新环境搭建、创新主体培育、