论文部分内容阅读
网格中的数据管理以命名的透明性、位置的透明性、协议的透明性、时间的透明性为目标,建立一个网格环境下数据一体化访问、存储、传输、维护的环境。它面向底层屏蔽网格中的各种异构的存储设备和数据资源,面向上层提供通用和可靠的数据访问服务,为用户提供一体化的数据管理和高性能数据处理服务。随着教育信息化程度的提高,很多科研和教学活动都需要用到各个学校的教育资源。现阶段每个高校都拥有大量、复杂的教育资源,而这些资源大部分是异构、分布、闲置、孤立的,因此严重阻碍了人们的交流和共享。教育资源网格计划使得全国各高校的分布、异构、自治的教育资源可以很好的共享和集成。如何对全国各高校的海量教育、教学管理资源进行便捷共享访问,正是教育资源网格环境下数据管理所要研究的主要内容。本文分析了当前网格数据管理的优点和缺点,比较了几种用于数据管理的中间件技术,结合教育资源网格的特点设计了一个网格数据管理中间件模型,并对其中的数据管理关键问题做出了相关研究。实验表明,教育资源网格中的数据管理使用本文设计的网格环境下数据管理中间件模型,可以较好的解决大量数据请求的传输效率问题,访问瓶颈问题,增强可靠性、一致性。具体来说,本文所做的主要工作和创新点包括:1.根据教育资源网格的特点,提出了适合于教育资源网格的拓扑结构—三阶梯式P2P,该结构既有网格的高性能和高可靠性特点,也有P2P的强扩展性、自组织性和容错性特点。这可以实现教育资源的层次式分布管理。2.给出了网格数据管理中间件模型ER-D3M,在ER-D3M模型的基础上讨论其中各个服务和策略的应用。该模型为用户提供了一体化的数据管理和高性能数据处理服务。3.提出了教育资源的整合服务,把教育资源与教学管理有机的结合在一起,为用户提供了统一的数据视图,也是对进一步发展的教育资源网格协同工作的探究。提出了基于用户访问相似度的聚集策略,该策略可以发掘共享资源的用户之间的内在联系和关联,减少了教育资源网格中的传输流量。4.提出了文件远程浏览控制服务和基于文件单体量测定的网格数据传输代理策略,前者融合了Web Service技术,实现了用户远程透明浏览访问,与现有OGSA体系很好的兼容。后者通过传输代理策略针对不同文件单体量大小选择不同传输协议来进行传输,达到了优化传输速率的目的。5.给出了基于副本目录索引的副本一致性维护算法,该算法结合基于轨迹标签的副本一致性维护算法和三阶梯式P2P的教育资源网格结构,具有传播冗余信息少,传播更新消息个数少,索引的存储代价低和更新覆盖度高的优点。6.对于本文提出的算法和策略,需要编程实现和模拟实验验证其正确性和性能。本文首先给出了教育资源整合服务和文件远程浏览控制服务的具体实现。其次,对基于文件单体量测定的网格数据传输代理策略进行了数据传输的实验,得到了良好的实验结果。最后利用BRITE按照一定的规则生成教育资源网格拓扑结构,对基于副本目录索引的一致性维护算法和其他一致性维护算法进行了模拟比较实验,验证了该算法的优越性。