论文部分内容阅读
可变剪接方法是当前生物信息学领域的一种重要的研究工具,它通过调节选择不同的外显子的组合方式来搜索mRNA亚型的可能,已经成为扩展蛋白质组变体的最主要的方法。近几年里,网格计算和Web Service技术结合的越来越紧密,把web服务技术作为实现网格内互操作的协议标准,通过服务的形式来虚拟化计算资源,对外提供计算、资源的发现、共享和整合的能力是当前网格计算技术的一个重要发展趋势。可变剪接程序基于传统的技术开发,使用C++语言编写,目前只能在linux系统中运行,并不符合web服务标准。如何使用这些协议充分利用通用网格中间件所提供的基础设施,把类似可变剪接这类成熟稳定,应用广泛的科学计算遗产程序,以网格服务的形式部署到网格系统中,使用网格计算环境整合的计算资源,帮助科学研究工作者解决科学计算问题是我们面临的一个挑战。
本文以可变剪接问题作为实例,研究科学计算遗产程序和计算资源的网格虚拟化和创建网格计算环境的问题。
首先简要的分析了网格研究的背景,当前重要的网格访问中间件以及网格计算技术发展的现状和趋势。
然后针对可变剪接问题分析了科学计算遗产程序的计算特征以及我们遇到的挑战,并且给出了一个适合科学计算遗产程序的网格计算环境的设计和实现。在我们的网格计算环境中,可变剪接领域服务按照领域信息聚合了网格中可以使用可变剪接程序的计算资源,为该领域的网格用户提供容易理解和使用的、领域相关的网格计算接口。在领域服务中我们将具有相同的资源需求和资源约束的计算资源组成一个领域资源组,并实现了一组并发的计算作业到领域资源组中计算资源的实时映射。使用领域服务可以方便的实现海量计算任务在位于不同管理域的计算资源的协同工作。本地支撑服务对外提供一致的资源访问接口,对内通过适配器与本地作业管理系统交互管理和使用计算资源。本地支撑服务根据遗产程序的元数据描述信息,为遗产程序创建一个与计算资源的本地配置密切相关的本地计算环境,支持遗产程序的执行,并监控运行状态,使得用户在网格上提交执行作业的过程能够了解到几乎与本地执行同样多的状态信息。网格编程.API是一组灵活的、容易使用的网格应用程序编程接口,它帮助网格用户根据各自领域的研究目标,灵活的实现满足自己研究目标的网格应用程序。
目前我们已经完成了一个可变剪接网格计算环境的原型实现,并给出了实验结果和性能比较分析,证明了我们提出的框架具有很好的性能和实用性。
最后除了总结我们研究工作之外,还对未来的研究工作进行了展望,并提出了三个需要在未来改进的工作。