论文部分内容阅读
摘要:随着信息技术迅速发展,数量众多的信息系统被建立,但由于各系统的信息资源无法共享、交换,形成了许多“信息孤岛”,导致了信息资源得不到充分利用。另一方面,原先集中管理、集中存储的资源组织管理模式已经不能适应网络发展、资源应用等实际需求。为了整合信息资源,人们基于元数据开展了诸多研究,并提出了一些基于元数据的信息资源整合模型。本文首先分析了这些模型的特点及适用范围,然后通过分析教育资源整合的特点,指出现有模型的不足之处。然后,在现有信息资源整合模型基础上,设计出了ERIM模型。该模型采用信息资源分散存储、元数据局部集中的存储策略,能适应更广范围的信息资源整合。借助ERIM模型,可在不改动原有系统的前提下实现跨平台分布式共享和互操作,把分散在“信息孤岛”中的信息资源整合起来, 方便了用户查找和使用。为了说明模型的可行性,本文介绍了ERIM模型在教育门户原型建设中的应用情况,ERIM是构建分布共享信息资源数字环境、实现信息资源共建共享的有益探索。
关键词:资源整合;模型; Web服务;教育门户
中图分类号:TP391 文献标识码:A 文章编号:1007-9599 (2012) 13-0000-02
近年来,在教育领域,随着信息化的迅速发展,数量众多的各类信息管理系统被陆续创建出来,这些系统中包含着丰富的信息资源。但是由于缺乏一个统一的资源建设的标准?和规范,以及资源开发者的不同背景和方向,使得网上充斥着由各种不同开发者制作的不同方向、不同领域、不同格式的各色教育资源。这些资源被限制在受限的、私有的信息管理系统、流媒体服务器和在线协作工具之中,系统之间缺乏互操作性,信息资源无法共享、交换,形成了许多互不联系的“信息孤岛”。另一方面,仅仅借助传统网络搜索引擎,难以准确的查找信息资源[1],使得用户无法迅速、准确的从网上丰富的资源海洋中查找所需信息。这大大限制了信息资源的交流与共享,造成了资源重复建设和浪费。因此,有必要为这些信息资源提供一种高效的共享及应用模式,以便于用户方便高效的查找、获取和使用信息资源。
为了消除信息孤岛、整合信息资源,人们基于元数据开展了诸多研究,并提出了一些基于元数据的信息资源整合模型。本文第1部分首先分析了这些模型的特点及适用范围,然后通过分析教育资源整合的特点,指出其不足之处。第2部分详细描述了模型ERIM。第3部分介绍了ERIM模型在教育门户建设中的应用情况。第4部分对全文进行总结,指出了ERIM下一步的完善方向。
一、现有模型比较及教育资源整合需求
(一)现有模型比较
基于元数据的信息资源整合模型要求首先用元数据来描述信息资源,然后定义信息资源及其元数据的存放策略、同步协议将来自不同信息系统的信息资源整合到一点,进而允许来源各异的信息资源被单点检索、访问。
按照信息资源及其元数据的存放策略、同步协议的不同可分为三类。下面分别介绍每类的特点及适用范围,见表1。
模型1:信息资源和元数据都集中
此类模型要求信息资源及其的元数据集中均存储在一点,无需同步协议。其优点是信息资源使用方便高效。缺点有三:一是信息资源集中于一点,各被整合系统需将信息资源和元数据更新到中心点,对中心点要求高(如需拥有大的带宽、计算能力和存储能力等);二是用此模型实施需要对被整合系统有很强的约束力,唯有如此,方能制定统一整合方案,并得以落实;三是如果被整合系统已建立,往往需要做较大调整,甚至推倒重来,影响较大。综上,该模型适合单信息系统(现有的大多数MIS系统都是这一模型)或整合部门内部的各信息系统,这是因为整合范围小,对中心点要求低;部门内部容易协调;系统调整代价小。
模型2:信息资源和元数据都分散
此模型与上一模型完全相反,它将信息资源及其元数据均分散存储在各被整合系统,要求各被整合系统公布其元数据查询及信息资源获取接口,并将这些接口集中存储在中心点。通过遍历所有元数据查询接口,来检索资源;并通过信息资源获取接口来获得资源。该模型的中心点只是提供了一个入口,元数据及信息资源的查询、获取都是通过访问被整合系统来完成的。相对于上一模型,该模型的优点有三:一是对中心点的要求低;二是对各被整合系统通过接口提供信息资源,系统改造难度低,且无需很强的约束力。该模型的缺点也很显著,主要是信息查询和获取需要遍历各系统的接口,效率低,对用户不友好。综合上述特点,该模型一般用于组织间的资源整合。比较典型的应用是DNS。在DNS中,可将网站本身看作是信息资源,域名看作是元数据。大量网站分布在全球各地,而其域名分布在各DNS服务器中,这些DNS构成一个树形结构。
模型3:信息资源分散、元数据集中
此模型综合了上述两模型,将信息资源分散存储在各被整合系统,而将元数据集中存储在一点。并制定元数据同步协议,即各被整合系统一旦修改了信息资源元数据,则将修改同步到中心点,而信息资源无需同步到中心点。在此模型,对元数据的查询完全在中心点进行,方便高效;而对信息资源的获取,仍需访问其所在的信息系统。这种模型保留了第2种模型对中心点要求低的优点,并在一定程度上保留了第1种模型的用户友好性。美国的GEM[4]正是采用这一模型实现了全国教育资源统一查询与使用。但如果被整合系统数目过于庞大,仅仅同步、存储元数据对中心点的要求仍然较大。综上,该模型适合于数目受限的组织间或组织内各部门间的整合。
(二)教育资源整合需求
教育信息资源,简称教育资源,亦称为学习资源,是指用于教学过程及其评价与管理的教材、课件、辅导资料、参考资料、习题集、试题集、工具型资料、教学标准与过程规范等,既可以是数字形态的,也可以是非数字形态的。目前,越来越多的教育资源以数字形态产生,并通过计算机系统和网络加以应用。这些资源可以根据不同需要,以不同层次和角度以及多种技术方法来相互连接和重组[2]。
教育资源广泛存在于学校、培训机构、教育相关的政府部门中的信息系统中,这些系统的数量是十分庞大的,难以采用上述模型1和模型3;而如果采用模型2,则难以保证系统对用户的友好性。可见,单纯采用上述任何一个模型都无法满足要求。 二、 ERIM 模型
为了设计一种满足教育资源整合需求,并具有良好用户友好性、并支持更大数目的被整合系统的信息整合模型,我们提出了ERIM(Education Resource Integration Model)信息模型。下面分别从资源描述、资源存储、同步机制及接口三个方面来介绍。
(一)资源描述
在ERIM中,要求所有教育资源以统一的元数据来描述,这是对教育资源进行整合的基础。目前国内外已有多个教育资源元数据规范,如DC-Education(Dublin Core Metadata-Education,都柏林核心教育元数据)、LOM(Learning Object Metadata,学习对象元数据)、IMS(Instructional Management System,教学管理系统)元数据、我国的CELTS (China E-Learning Technology Standardization,中国教育信息化技术标准体系)等。可借助这些元数据规范制定ERIM元数据描述规范,将不在本文展开介绍。对于已建成的教育MIS,由于其元数据与ERIM元数据不一致,需要各教育MIS提供将其元数据映射到ERIM元数据的方法。
(二)资源存储
在ERIM中,对教育资源仍然采用分散存储的策略(类似于模型2、3),但对元数据采取局部集中的方式,增大其分散粒度,即按照一定规则(如可按照组织关系、网络状况等)将教育MIS进行分组,将组内的教育MIS放在一个域中,在域内采用模型3的元数据存储及同步策略,域间采用模型2的元数据存储及同步策略。
总体设计如图1所示,在每个域中包含多个教育MIS、一个域服务器、一个域门户。其中域服务器集中存放来自各教育MIS中的元数据;域门户提供入口,用于查询域服务器的元数据信息,并获取教育资源,通过域门户仅可以访问本域元数据及资源。可见借助域服务器和域门户实现了本域的资源整合,确保了域的自治性。通过中心服务器和中心门户,将多个域整合在一起,实现了更大范围的资源整合。中心服务器并不集中存放教育资源的元数据,在需要时,它通过遍历各个域服务器,来查询元数据。中心门户为访问中心服务器提供入口,允许对所有域中的元数据和教育资源进行查询和访问。相对于域门户,中心门户延迟较大,但获取的信息量更全面。特别要说明的是,在域数目较少时,中心服务器可以只有一层;如果域数目较多,可仿效DNS构成多层的树形结构。
(三)同步机制及接口
在确定了资源存储策略后,需要制定资源同步机制来实现全局的资源同步。在ERIM,借助3类典型接口来实现资源同步,如图2所示。下面分别从域内同步、域间同步两方面来介绍。
1.域内同步
由于在域内采用元数据集中、资源分散的存储策略,域服务器提供一个元数据同步接口(图2白点),以备域内教育MIS调用,使其在更新了元数据后,将元数据及时同步到域服务器;各教育MIS提供一个资源获取接口(图2域内黑点),以备域服务器调用,使其根据用户要求从各教育MIS获取教育资源。
预先需要将各教育MIS的资源获取接口地址配置到域服务器,并在各教育MIS中配置域服务器的元数据更新接口。为了域服务器以统一的方式访问资源获取接口,最好统一各教育MIS的资源获取接口的名称、参数。
2.域间同步
由于在域内采用元数据分散、资源分散的存储策略,域服务器提供一个元数据查询接口(图2灰点),以备中心服务器调用,使其根据用户要求查询各域的元数据;域服务器还需提供一个资源获取接口(图2域外黑点),以备中心服务器调用,使其根据用户要求获取相应的教育资源(当调用该接口时,域服务器将调用相应教育MIS的资源获取接口获取资源并返回给中心服务器。期间,域服务器可进行权限检查)。
预先需将各域的元数据查询接口、资源获取接口的地址配置到中心服务器。为了中心服务器以统一的方式访问这些接口,最好统一这些接口的名称、参数。
三、 ERIM在教育门户中的应用
为了验证ERIM模型的可行性,基于此模型开发了教育门户原型。在该原型中,将来自四个教育MIS的课件资源进行整合,并建立了域及中心两级门户,在两级门户中均建立了在线学习应用。用户仅需登录中心门户,就能够透明的对来自四个教育MIS的课件资源进行检索,并获取感兴趣的课件。在应用中最关键的是各个接口的设计与实现。为了保证接口跨平台性、统一性,我们采用了Web Service技术来设计接口,并基于Axis2实现了接口。教育门户原型的成功建立充分说明了ERIM模型的有效性。
四、总结
在现有的基于元数据的信息资源整合模型基础上,本文提出了ERIM模型,该模型采用信息资源分散存储、元数据局部集中的存储策略,能适应海量信息系统的信息资源整合。借助ERIM模型,可在不改动原有系统的前提下实现跨平台分布式共享和互操作,把分散在“信息孤岛”中的信息资源整合起来, 方便了用户查找、获取和使用。ERIM是构建分布共享信息资源数字环境、实现信息资源共建共享的有益探索。
参考文献:
[1]赵刚.网络环境下基于Web服务的多媒体课件库建设[J].太原城市职业技术学院学报,2008,8(8):133-134
[2]王昉,张晓林.面向教育资源的元数据[J].情报杂志,2002,7
[3]赵志刚,刘方爱.学校互操作框架(SIF)的多区域通信研究[J].计算机工程与应用,2005.30,41(30):130-133
[4]美国教育门户GEM[EB/OL]:http://www.thegateway.org/
[作者简介]朱晓丽(1979-),女,讲师,硕士,主要研究方向:资源整合、服务计算。
关键词:资源整合;模型; Web服务;教育门户
中图分类号:TP391 文献标识码:A 文章编号:1007-9599 (2012) 13-0000-02
近年来,在教育领域,随着信息化的迅速发展,数量众多的各类信息管理系统被陆续创建出来,这些系统中包含着丰富的信息资源。但是由于缺乏一个统一的资源建设的标准?和规范,以及资源开发者的不同背景和方向,使得网上充斥着由各种不同开发者制作的不同方向、不同领域、不同格式的各色教育资源。这些资源被限制在受限的、私有的信息管理系统、流媒体服务器和在线协作工具之中,系统之间缺乏互操作性,信息资源无法共享、交换,形成了许多互不联系的“信息孤岛”。另一方面,仅仅借助传统网络搜索引擎,难以准确的查找信息资源[1],使得用户无法迅速、准确的从网上丰富的资源海洋中查找所需信息。这大大限制了信息资源的交流与共享,造成了资源重复建设和浪费。因此,有必要为这些信息资源提供一种高效的共享及应用模式,以便于用户方便高效的查找、获取和使用信息资源。
为了消除信息孤岛、整合信息资源,人们基于元数据开展了诸多研究,并提出了一些基于元数据的信息资源整合模型。本文第1部分首先分析了这些模型的特点及适用范围,然后通过分析教育资源整合的特点,指出其不足之处。第2部分详细描述了模型ERIM。第3部分介绍了ERIM模型在教育门户建设中的应用情况。第4部分对全文进行总结,指出了ERIM下一步的完善方向。
一、现有模型比较及教育资源整合需求
(一)现有模型比较
基于元数据的信息资源整合模型要求首先用元数据来描述信息资源,然后定义信息资源及其元数据的存放策略、同步协议将来自不同信息系统的信息资源整合到一点,进而允许来源各异的信息资源被单点检索、访问。
按照信息资源及其元数据的存放策略、同步协议的不同可分为三类。下面分别介绍每类的特点及适用范围,见表1。
模型1:信息资源和元数据都集中
此类模型要求信息资源及其的元数据集中均存储在一点,无需同步协议。其优点是信息资源使用方便高效。缺点有三:一是信息资源集中于一点,各被整合系统需将信息资源和元数据更新到中心点,对中心点要求高(如需拥有大的带宽、计算能力和存储能力等);二是用此模型实施需要对被整合系统有很强的约束力,唯有如此,方能制定统一整合方案,并得以落实;三是如果被整合系统已建立,往往需要做较大调整,甚至推倒重来,影响较大。综上,该模型适合单信息系统(现有的大多数MIS系统都是这一模型)或整合部门内部的各信息系统,这是因为整合范围小,对中心点要求低;部门内部容易协调;系统调整代价小。
模型2:信息资源和元数据都分散
此模型与上一模型完全相反,它将信息资源及其元数据均分散存储在各被整合系统,要求各被整合系统公布其元数据查询及信息资源获取接口,并将这些接口集中存储在中心点。通过遍历所有元数据查询接口,来检索资源;并通过信息资源获取接口来获得资源。该模型的中心点只是提供了一个入口,元数据及信息资源的查询、获取都是通过访问被整合系统来完成的。相对于上一模型,该模型的优点有三:一是对中心点的要求低;二是对各被整合系统通过接口提供信息资源,系统改造难度低,且无需很强的约束力。该模型的缺点也很显著,主要是信息查询和获取需要遍历各系统的接口,效率低,对用户不友好。综合上述特点,该模型一般用于组织间的资源整合。比较典型的应用是DNS。在DNS中,可将网站本身看作是信息资源,域名看作是元数据。大量网站分布在全球各地,而其域名分布在各DNS服务器中,这些DNS构成一个树形结构。
模型3:信息资源分散、元数据集中
此模型综合了上述两模型,将信息资源分散存储在各被整合系统,而将元数据集中存储在一点。并制定元数据同步协议,即各被整合系统一旦修改了信息资源元数据,则将修改同步到中心点,而信息资源无需同步到中心点。在此模型,对元数据的查询完全在中心点进行,方便高效;而对信息资源的获取,仍需访问其所在的信息系统。这种模型保留了第2种模型对中心点要求低的优点,并在一定程度上保留了第1种模型的用户友好性。美国的GEM[4]正是采用这一模型实现了全国教育资源统一查询与使用。但如果被整合系统数目过于庞大,仅仅同步、存储元数据对中心点的要求仍然较大。综上,该模型适合于数目受限的组织间或组织内各部门间的整合。
(二)教育资源整合需求
教育信息资源,简称教育资源,亦称为学习资源,是指用于教学过程及其评价与管理的教材、课件、辅导资料、参考资料、习题集、试题集、工具型资料、教学标准与过程规范等,既可以是数字形态的,也可以是非数字形态的。目前,越来越多的教育资源以数字形态产生,并通过计算机系统和网络加以应用。这些资源可以根据不同需要,以不同层次和角度以及多种技术方法来相互连接和重组[2]。
教育资源广泛存在于学校、培训机构、教育相关的政府部门中的信息系统中,这些系统的数量是十分庞大的,难以采用上述模型1和模型3;而如果采用模型2,则难以保证系统对用户的友好性。可见,单纯采用上述任何一个模型都无法满足要求。 二、 ERIM 模型
为了设计一种满足教育资源整合需求,并具有良好用户友好性、并支持更大数目的被整合系统的信息整合模型,我们提出了ERIM(Education Resource Integration Model)信息模型。下面分别从资源描述、资源存储、同步机制及接口三个方面来介绍。
(一)资源描述
在ERIM中,要求所有教育资源以统一的元数据来描述,这是对教育资源进行整合的基础。目前国内外已有多个教育资源元数据规范,如DC-Education(Dublin Core Metadata-Education,都柏林核心教育元数据)、LOM(Learning Object Metadata,学习对象元数据)、IMS(Instructional Management System,教学管理系统)元数据、我国的CELTS (China E-Learning Technology Standardization,中国教育信息化技术标准体系)等。可借助这些元数据规范制定ERIM元数据描述规范,将不在本文展开介绍。对于已建成的教育MIS,由于其元数据与ERIM元数据不一致,需要各教育MIS提供将其元数据映射到ERIM元数据的方法。
(二)资源存储
在ERIM中,对教育资源仍然采用分散存储的策略(类似于模型2、3),但对元数据采取局部集中的方式,增大其分散粒度,即按照一定规则(如可按照组织关系、网络状况等)将教育MIS进行分组,将组内的教育MIS放在一个域中,在域内采用模型3的元数据存储及同步策略,域间采用模型2的元数据存储及同步策略。
总体设计如图1所示,在每个域中包含多个教育MIS、一个域服务器、一个域门户。其中域服务器集中存放来自各教育MIS中的元数据;域门户提供入口,用于查询域服务器的元数据信息,并获取教育资源,通过域门户仅可以访问本域元数据及资源。可见借助域服务器和域门户实现了本域的资源整合,确保了域的自治性。通过中心服务器和中心门户,将多个域整合在一起,实现了更大范围的资源整合。中心服务器并不集中存放教育资源的元数据,在需要时,它通过遍历各个域服务器,来查询元数据。中心门户为访问中心服务器提供入口,允许对所有域中的元数据和教育资源进行查询和访问。相对于域门户,中心门户延迟较大,但获取的信息量更全面。特别要说明的是,在域数目较少时,中心服务器可以只有一层;如果域数目较多,可仿效DNS构成多层的树形结构。
(三)同步机制及接口
在确定了资源存储策略后,需要制定资源同步机制来实现全局的资源同步。在ERIM,借助3类典型接口来实现资源同步,如图2所示。下面分别从域内同步、域间同步两方面来介绍。
1.域内同步
由于在域内采用元数据集中、资源分散的存储策略,域服务器提供一个元数据同步接口(图2白点),以备域内教育MIS调用,使其在更新了元数据后,将元数据及时同步到域服务器;各教育MIS提供一个资源获取接口(图2域内黑点),以备域服务器调用,使其根据用户要求从各教育MIS获取教育资源。
预先需要将各教育MIS的资源获取接口地址配置到域服务器,并在各教育MIS中配置域服务器的元数据更新接口。为了域服务器以统一的方式访问资源获取接口,最好统一各教育MIS的资源获取接口的名称、参数。
2.域间同步
由于在域内采用元数据分散、资源分散的存储策略,域服务器提供一个元数据查询接口(图2灰点),以备中心服务器调用,使其根据用户要求查询各域的元数据;域服务器还需提供一个资源获取接口(图2域外黑点),以备中心服务器调用,使其根据用户要求获取相应的教育资源(当调用该接口时,域服务器将调用相应教育MIS的资源获取接口获取资源并返回给中心服务器。期间,域服务器可进行权限检查)。
预先需将各域的元数据查询接口、资源获取接口的地址配置到中心服务器。为了中心服务器以统一的方式访问这些接口,最好统一这些接口的名称、参数。
三、 ERIM在教育门户中的应用
为了验证ERIM模型的可行性,基于此模型开发了教育门户原型。在该原型中,将来自四个教育MIS的课件资源进行整合,并建立了域及中心两级门户,在两级门户中均建立了在线学习应用。用户仅需登录中心门户,就能够透明的对来自四个教育MIS的课件资源进行检索,并获取感兴趣的课件。在应用中最关键的是各个接口的设计与实现。为了保证接口跨平台性、统一性,我们采用了Web Service技术来设计接口,并基于Axis2实现了接口。教育门户原型的成功建立充分说明了ERIM模型的有效性。
四、总结
在现有的基于元数据的信息资源整合模型基础上,本文提出了ERIM模型,该模型采用信息资源分散存储、元数据局部集中的存储策略,能适应海量信息系统的信息资源整合。借助ERIM模型,可在不改动原有系统的前提下实现跨平台分布式共享和互操作,把分散在“信息孤岛”中的信息资源整合起来, 方便了用户查找、获取和使用。ERIM是构建分布共享信息资源数字环境、实现信息资源共建共享的有益探索。
参考文献:
[1]赵刚.网络环境下基于Web服务的多媒体课件库建设[J].太原城市职业技术学院学报,2008,8(8):133-134
[2]王昉,张晓林.面向教育资源的元数据[J].情报杂志,2002,7
[3]赵志刚,刘方爱.学校互操作框架(SIF)的多区域通信研究[J].计算机工程与应用,2005.30,41(30):130-133
[4]美国教育门户GEM[EB/OL]:http://www.thegateway.org/
[作者简介]朱晓丽(1979-),女,讲师,硕士,主要研究方向:资源整合、服务计算。