论文部分内容阅读
文摘:在高速发展的经济时代,网络信息资源成为人们获得信息的重要资源,图书馆承担着对网络信息资源优化的新任务,笔者分析如何将大量、蘩杂的网络信息优化,构建数字化信息资源体系,提高图书馆的服务水平。
关键词:高校图书馆 网络信息资源 优化
用户所需的信息如何快速地从大量的网络信息资源中搜索到,这是高校图书馆应当帮助用户解决的问题,图书馆如何将网络信息源进行优化,形成一个有序化且便于检索信息资源集合,这是用户对高校图书馆提出的新要求,也是图书馆的责任所在。对网络信息资源的优化,一方面可以构建数字化信息资源体系,使网络信息资源的能够得到更有效的开发和利用,实现网络信息资源实现共享;另一方面还可以进行知识的创新。对网络信息源进行宏观组织与微观管理已势在必行。
网络信息一般有纯图像、目录文本、正文图像、全文本、全文索引等形式,不论什么形式的网络信息,都可分成为对象数据与元数据,对象数据是指网络信息中的文本、图像、声言、影像等,元数据则是指对文本、图像、声言、影像的进行描述和管理的数据。对象数据以分散的形式存放在各地的资源站点,元数据是集中存放在图书馆中心的服务器上。用户查询时,系统是通过元数据来调度各对象数据库以提供服务。网络信息资源的优化,就是把网络信息源按照特定的方式进行搜集、整理和重组,使每一条信息具有有序化、可访问化,形成一个便于检索、访问的有序化信息集合。如果每个信息资源在信息描述、数据库定义和访问方式等方面遵守一定的通用标准,成为一个普遍适用的网络信息资源集合。
一、确立优化原则
1、标准化原则
标准化原则主要包括数据格式、描述语言、标引语言、通讯协议、安全保障技术标等都要标准化,确保信息资源的共享。
2、优化性原则
优化性原则即是用现代技术手段和方法,将网络信息资源重新合理组合,发挥其最优的组织结构和织织功能。
3、针对性原则。
网络信息资源的重组,目的是使不同类型的用户更方、快捷地利用信息资源,高校图书馆要有针对性地确定网络信息资源重组的范围、重点,分析信息需求、信息来源及信息的分布状况。
4、持续性原则。
高校图书馆要开展有个性信息服务,满足不同类型用户的信息需求,要了解、掌握信息的变化,连续地采集、积累相关信息,信息的连续件是网络信息资源发挥效用的前提条件。
5、共享性原则。
网络信息资源优化,改变信息资源的体系结构,实现网络化信息服务,使信息资源利用最大化。
二、网络信息源重组流程
可采用Web挖掘。利用数据挖掘技术,在大量的、不完全的数据(包括Web文档和web活动),抽取隐含的、事先不知道又可能利用的信息源。数据挖掘是以数据仓库技术为基础,分析各种源数据,从而发现隐藏在大量原始数据深层次中的对人们有用的模式。这些被抽取的模式一般具备有效、新颖、潜在有用、易于理解等等。挖掘流程如图:分析用户需求 确定开发目标 搜集处理数 据形成数据库
1、对需求的分析。分析用户的目的需求,根据需求对象确定网络信息搜集的内容,做到有的放矢,节约时间和人力物力。用户需求一般可分为是实用性用户。目的是对自己进行知识和技能的更新。是学术知识性用户。此用户的目的是在网络上搜集某特定的最新、最前沿的信息。是休闲知识性用户。该类用户在网络上主要进行娱乐和消遣活动。
2、确定开发目标。可先对用户在web上检索实用性知识、学术知识性、休闲与消遣知识次数分析,从中找出每类知识在某些方面最大需求,及用户对某些知识点搜索次数进行统计,也可从用户访问web面后,留在服务器上web日志记录和相关数据,包括所请示的URL、发出请求的IP地址和时间等明确用户的需求,从而在网络上搜集用户所需求的实用性知识、学术知识性、休闲与消遣知识性,包括文字数据、视频数据、图形图像数据的多媒体数据等。明确网络信息资源的搜集方位,才能做到有的放矢,合理分配人力、财力和时间。
3、搜集、处理相应数据,形成数据库。
首先,搜集与目标有关的数据,建立相关焦点子集数据。网络信息资源集合是由无数个信息源组成(比如数据库),每个信息源又是由很多同序的信息实体组成(例如数据库记录)。搜集每个信息源或信息实体就是要形成焦点子集数据,这个过程实际上就是滤掉无科学性的虚假信息。根据这些焦点子集数据其所具有的特点,确定采集途径和采集策略,为建立引导信息数据库(例如题录、文摘数据库、网络资源导航、资源链接目录和信息源数据库等)作准备。
其次处理数据并规范化,形成数据库。对搜集的数据进行处理,主要是对这些信息按一定规律进行规范、标引、存储,成为一条条有组织、有规律、可访问的信息,目的是建立引导信息数据库,使用户通过检索获得所需,从而满足用户对信息的需求,这个过程是数字化信息资源体系的重要组成,也是信息资源共享的重要措施。通过对不同类型信息进行规范、有序、标引、存储,建立不同类型的数据库。如下图:
无数个实用信息实体 无数个学术信息实体 无数个休闲信息实体
相应焦点子集数据库 相应焦点子集数据库 相应焦点子集数据库
建立引导信息数据库
三、网络信息资源重优化方式
网络信息资源重组内容的划分,可参照纸质文献的划分方法,将网络信息资源划分为四种,零次信息、一次信息、二次信息、三次信息等层次,对这四个层次的网络信息资源进行重组,达到资源的优化。
1、对零次信息的重组。零次信息(如行政、科技报告、学位论文、内部刊物、专家手稿、会议论文、调研报告等。)具有专业性强、量大、交流范围狭小但研究水平高等特点。分类搜集加工、整理和开发,成为网上可资利用的重要信息资源。
(2)一次信息的重组。就是将丰富的网络信息资源加工、优化、整合。可以通过自由文本方式、超文本方式以和主页方式进行组织,其中用自由文本方式可建造全文数据库,用超文本方式将网络上相关文本的信息有机地组在一起,用户可从任意节点开始,不同角度浏览和查询信息。用主页方式组织有关的机构和个人的信息。
(3)二次信息的重组。对一次信息进行加工、提炼、浓缩就是二次信息。二次信息的组织一方面用搜索引擎,是自动搜索Web服务器的信息,有针对性地从网上选择所需文献,将信息进行分类并建立相关的索引,然后把索引的内容存放到数据库,另一方面开发自动搜索、动进行转换、自动著录、自动提取关键词等软件,使其能自动辨别和整理,并以方便的网页形式传递给用户。
(4)三次信息的重组。目前的搜索引擎都有各有其特点和功能,搜索引擎不同,有不同的查找功能,实现搜索的方法也不同。为此,可用类式于“文献链” (文献链是一种庞大的文献引用系统)的方法,对网上二次信息进行二次替代,从形成网上三次信息,进一步提高网络信息资源开发利用。
四、结束语
网络信息资源的优化是图书馆的面临的新问题,直接影响图书馆的服务水平,也是图书馆工作人员面临的新任务。
沈利峰 数字图书馆网络信息资源整合研究 中国农业科学院 2005.6
郭振安.《网络信息资源重组理论与实践》兵器工业出版社 2004.4
杨文祥 毕强.《网络信息资源开发与利用》科学出版社 2002.11
关键词:高校图书馆 网络信息资源 优化
用户所需的信息如何快速地从大量的网络信息资源中搜索到,这是高校图书馆应当帮助用户解决的问题,图书馆如何将网络信息源进行优化,形成一个有序化且便于检索信息资源集合,这是用户对高校图书馆提出的新要求,也是图书馆的责任所在。对网络信息资源的优化,一方面可以构建数字化信息资源体系,使网络信息资源的能够得到更有效的开发和利用,实现网络信息资源实现共享;另一方面还可以进行知识的创新。对网络信息源进行宏观组织与微观管理已势在必行。
网络信息一般有纯图像、目录文本、正文图像、全文本、全文索引等形式,不论什么形式的网络信息,都可分成为对象数据与元数据,对象数据是指网络信息中的文本、图像、声言、影像等,元数据则是指对文本、图像、声言、影像的进行描述和管理的数据。对象数据以分散的形式存放在各地的资源站点,元数据是集中存放在图书馆中心的服务器上。用户查询时,系统是通过元数据来调度各对象数据库以提供服务。网络信息资源的优化,就是把网络信息源按照特定的方式进行搜集、整理和重组,使每一条信息具有有序化、可访问化,形成一个便于检索、访问的有序化信息集合。如果每个信息资源在信息描述、数据库定义和访问方式等方面遵守一定的通用标准,成为一个普遍适用的网络信息资源集合。
一、确立优化原则
1、标准化原则
标准化原则主要包括数据格式、描述语言、标引语言、通讯协议、安全保障技术标等都要标准化,确保信息资源的共享。
2、优化性原则
优化性原则即是用现代技术手段和方法,将网络信息资源重新合理组合,发挥其最优的组织结构和织织功能。
3、针对性原则。
网络信息资源的重组,目的是使不同类型的用户更方、快捷地利用信息资源,高校图书馆要有针对性地确定网络信息资源重组的范围、重点,分析信息需求、信息来源及信息的分布状况。
4、持续性原则。
高校图书馆要开展有个性信息服务,满足不同类型用户的信息需求,要了解、掌握信息的变化,连续地采集、积累相关信息,信息的连续件是网络信息资源发挥效用的前提条件。
5、共享性原则。
网络信息资源优化,改变信息资源的体系结构,实现网络化信息服务,使信息资源利用最大化。
二、网络信息源重组流程
可采用Web挖掘。利用数据挖掘技术,在大量的、不完全的数据(包括Web文档和web活动),抽取隐含的、事先不知道又可能利用的信息源。数据挖掘是以数据仓库技术为基础,分析各种源数据,从而发现隐藏在大量原始数据深层次中的对人们有用的模式。这些被抽取的模式一般具备有效、新颖、潜在有用、易于理解等等。挖掘流程如图:分析用户需求 确定开发目标 搜集处理数 据形成数据库
1、对需求的分析。分析用户的目的需求,根据需求对象确定网络信息搜集的内容,做到有的放矢,节约时间和人力物力。用户需求一般可分为是实用性用户。目的是对自己进行知识和技能的更新。是学术知识性用户。此用户的目的是在网络上搜集某特定的最新、最前沿的信息。是休闲知识性用户。该类用户在网络上主要进行娱乐和消遣活动。
2、确定开发目标。可先对用户在web上检索实用性知识、学术知识性、休闲与消遣知识次数分析,从中找出每类知识在某些方面最大需求,及用户对某些知识点搜索次数进行统计,也可从用户访问web面后,留在服务器上web日志记录和相关数据,包括所请示的URL、发出请求的IP地址和时间等明确用户的需求,从而在网络上搜集用户所需求的实用性知识、学术知识性、休闲与消遣知识性,包括文字数据、视频数据、图形图像数据的多媒体数据等。明确网络信息资源的搜集方位,才能做到有的放矢,合理分配人力、财力和时间。
3、搜集、处理相应数据,形成数据库。
首先,搜集与目标有关的数据,建立相关焦点子集数据。网络信息资源集合是由无数个信息源组成(比如数据库),每个信息源又是由很多同序的信息实体组成(例如数据库记录)。搜集每个信息源或信息实体就是要形成焦点子集数据,这个过程实际上就是滤掉无科学性的虚假信息。根据这些焦点子集数据其所具有的特点,确定采集途径和采集策略,为建立引导信息数据库(例如题录、文摘数据库、网络资源导航、资源链接目录和信息源数据库等)作准备。
其次处理数据并规范化,形成数据库。对搜集的数据进行处理,主要是对这些信息按一定规律进行规范、标引、存储,成为一条条有组织、有规律、可访问的信息,目的是建立引导信息数据库,使用户通过检索获得所需,从而满足用户对信息的需求,这个过程是数字化信息资源体系的重要组成,也是信息资源共享的重要措施。通过对不同类型信息进行规范、有序、标引、存储,建立不同类型的数据库。如下图:
无数个实用信息实体 无数个学术信息实体 无数个休闲信息实体
相应焦点子集数据库 相应焦点子集数据库 相应焦点子集数据库
建立引导信息数据库
三、网络信息资源重优化方式
网络信息资源重组内容的划分,可参照纸质文献的划分方法,将网络信息资源划分为四种,零次信息、一次信息、二次信息、三次信息等层次,对这四个层次的网络信息资源进行重组,达到资源的优化。
1、对零次信息的重组。零次信息(如行政、科技报告、学位论文、内部刊物、专家手稿、会议论文、调研报告等。)具有专业性强、量大、交流范围狭小但研究水平高等特点。分类搜集加工、整理和开发,成为网上可资利用的重要信息资源。
(2)一次信息的重组。就是将丰富的网络信息资源加工、优化、整合。可以通过自由文本方式、超文本方式以和主页方式进行组织,其中用自由文本方式可建造全文数据库,用超文本方式将网络上相关文本的信息有机地组在一起,用户可从任意节点开始,不同角度浏览和查询信息。用主页方式组织有关的机构和个人的信息。
(3)二次信息的重组。对一次信息进行加工、提炼、浓缩就是二次信息。二次信息的组织一方面用搜索引擎,是自动搜索Web服务器的信息,有针对性地从网上选择所需文献,将信息进行分类并建立相关的索引,然后把索引的内容存放到数据库,另一方面开发自动搜索、动进行转换、自动著录、自动提取关键词等软件,使其能自动辨别和整理,并以方便的网页形式传递给用户。
(4)三次信息的重组。目前的搜索引擎都有各有其特点和功能,搜索引擎不同,有不同的查找功能,实现搜索的方法也不同。为此,可用类式于“文献链” (文献链是一种庞大的文献引用系统)的方法,对网上二次信息进行二次替代,从形成网上三次信息,进一步提高网络信息资源开发利用。
四、结束语
网络信息资源的优化是图书馆的面临的新问题,直接影响图书馆的服务水平,也是图书馆工作人员面临的新任务。
沈利峰 数字图书馆网络信息资源整合研究 中国农业科学院 2005.6
郭振安.《网络信息资源重组理论与实践》兵器工业出版社 2004.4
杨文祥 毕强.《网络信息资源开发与利用》科学出版社 2002.11