Motif识别软件的性能分析及并行实现

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户:huihuiwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Motif识别算法及相应并行算法的研究和优化改进是国家自然科学基金重点项目“当代并行机的并行算法应用基础研究”的主要研究内容之一,寻找motif对于生物信息学的基因表达有着很重要的研究价值,其并行算法的研究是在超级计算机上进行大量motif识别计算研究的重要基础。本文围绕motif识别算法和软件,所做出的主要工作如下:   1)在大量文献调研的基础上,总结了motif寻找软件所使用的4种基本算法,并对每种算法的各种性能进行了评价。   2)motif寻找软件的时间分析   针对9种软件找出有代表性的4条序列,并选择统一的比较参数——motif长度、motif个数、似然说方法的循环次数等等,然后将这些软件在联想深腾6800超级计算机上进行测试,得出各种软件的运行时间并进行分析。实验证明,这些结果基本符合各软件相应算法的时间复杂度。   3)Weeder软件的并行模式设计   在深入了解Weeder的算法后,本文作者提出了一套MPI并行设计方案。其设计理念是将Weeder要读入的序列集进行分割,每个进程都算出各自即将运行的序列条数,并执行程序。最后主进程收集所有的结果,按照得分找出最佳的motif。从最后的加速比及并行效率可以看出,实验很好的实现了并行设计,实现了趋于线性的加速比以及较高的并行效率。   4)本文将并行优化后的Weeder软件包集成到中国国家网格上,可以为具有同样计算需求的科研人员提供计算服务。   本文为研究人员在选择motif识别算法与软件方面提供了参考;并设计了并行优化的Weeder软件,以及在中国国家网格上包装了并行Weeder软件以提供浏览器界面使用方式;此外,Weeder软件的并行化方法可为其它类似软件的并行优化提供重要参考。
其他文献
人群流量信息在实际当中应用广泛。除了安全控制和人群管理外,它还可用于更合理地安排各个时段的在岗工作人员数。例如:机场、车站、银行等从事程序化工作的场合。另外,可以更有
随着Internet技术的飞速发展,互联网已经变成了一个庞大的、分布式的、异构的数据库和应用计算平台。同时,不少传统计算机领域的技术都在向适应网络应用的方向拓展。网络操作系
自2000年以来,对等计算迅速成为计算机工业界和学术界关注的热点。对等计算中每个结点既作为服务器端提供服务,又作为客户端发出请求;结点之间实行直接对等交互;每个结点可以自
知识管理的模型和度量方法是知识管理领域深入研究的一个重要方向,也是知识管理从概念走向科学系统的关键问题。本文对知识资源、知识流、知识创新行为等进行了探索性的建模工
随着机电产品复杂程度的不断增加,基于模型的系统工程(Model BasedSystems Engineering,MBSE)日益成为多域复杂机电产品设计的重要方法。该方法强调系统设计模型在产品设计过程
在信息化战争中,指挥控制始终处在作战体系的核心位置。现代战争对战术辅助决策提出了新的要求,现代科技提供了新的辅助决策的方法。基于案例推理(Case-Based Reasoning,CBR)利
随着企业内以及互联网上电子文档的不断增多,用户亟需有效的检索方式从海量文本信息中快速获取所需的信息。文档检索和文档摘要是信息检索领域中两个基本并且相关的问题,两者结
电子商务是指基于广泛普及的互联网的商务活动。商务活动、金融活动等相关活动等都在网上进行,交易的双方基本上不需要碰面,即可完成一系列商务商业活动。  近年来,由于我国网
基于内容的图像检索(CBIR)系统突破了传统的基于字符表达式检索的局限,用户可通过测览选择示例或自己绘制图形来查询,能从大量分布式数据库中快速检索到有关图像。CBIR数据库系
生物识别技术是根据人体的自身所固有的生物或者行动特征来进行身份识别,如:声音识别、指纹识别、人脸识别、视网膜识别等等。主要应用领域有:银行、海关、公安、电子商务、