基于分布式框架的BLAST与并行系统的性能比较

来源 :中国生物工程学会2014年学术年会暨全国生物技术大会 | 被引量 : 0次 | 上传用户:net_worm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  传统的基于相似性算法的基因序列比对程序BLAST,在处理急剧增长的高通量基因测序数据时,由于其巨大的计算量和低效的读写操作,对计算机资源的需求激增导致研究成本上升,过长的运行时间也无法满足时效性要求。近年来,面向计算机集群的Map/Reduce(MR)数据处理框架,能够充分有效的发挥集群的计算和读写能力,使得程序的运行时间大大缩短。因此,将MR方法应用于BLAST算法中,理论上将能够在高通量基因测序数据处理性能上带来质的提升。本论文针对BLAST、mpiBLAST、Hadoop-BLAST进行了一系列综合测试,分别从加速比、单核运行效率两个指标比较了几种程序的性能差异。结果显示Hadoop-BLAST在MR框架下,随着集群节点数增加,其加速比更加明显,而且单核使用效率上更能够发挥集群资源优势,从而验证了分布式计算在数据读写上的优势理论。
其他文献
我们对294个HIV整合酶抑制剂进行定量构效关系(QSAR)研究并建立了QSAR模型,分析了影响抑制剂活性的关键结构特征.计算一系列能够反映化合物结构的理论描述符,通过逐步回归(stepwise)算法筛选出8个重要的描述符.基于这8种重要的描述符,我们应用多元线性回归方法(MLR)建立了QSAR模型,并对模型进行了内部验证(包括相关系数R2、交互验证相关系数Q2、均方根误差RMSE)和外部验证(包
实验证明人体 20 种氨基酸的疏水特性是不同的。通过研究蛋白质的疏水性对研究蛋 白质之间的亲密关系和平衡蛋白的结构和功能有着重要的意义。由于蛋白质疏水性问题导致 数据的高度复杂性,需构建图模型对其进行最短路径的计算。本文利用 Giraph 平台,对来 自蛋白质相互作用数据库(DIP)的蛋白质数据进行最短路径的计算与分析,并与传统蛋白 质分析软件 Cytoscape 产生的结果做对比,得到一致性结论
为了探明铁皮石斛组培体中药用和营养成分含量,比较研究了3种铁皮石斛组培体和人工栽培铁皮石斛干物率、多糖、总生物碱和总蛋白含量.结果表明:三年生人工栽培铁皮石斛茎段干物率为20.79%,显著高于3种铁皮石斛组培体,原球茎干物率为3.77%,显著低于2种组培苗;三年生人工栽培铁皮石斛茎段多糖和总生物碱含量分别为24.64%和0.027%,均显著高于3种铁皮石斛组培体,原球茎多糖和总生物碱含量分别为11
会议
目的 探讨一种新的高通量检测方法在脆性X综合征分子诊断中的应用。方法 从20例FXS临床疑似患者、33名患者父母中提取基因组DNA,以及购买的5份NIBSC FXS标准质控品DNA(07/120、07/122、07/168、07/170、07/174),采用荧光标记的CGG RP-PCR方法结合毛细管电泳技术,同时也行常规PCR分析。
简单重复序列亦称微卫星,被成功应用于许多真核生物、原核生物和病毒的基因组和进化研究,但是噬菌体中的微卫星目前很少被研究.因此对60条尾病毒目基因组中的微卫星和和复合型微卫星(由两个或两个以上直接相邻的微卫星组成)做了一个综合性分析,在这60个基因组中总共观察到11874个微卫星和449个复合型微卫星.相关性分析表明微卫星个数与基因组大小成正线性相关(ρ=0.899,P<0.01).参考序列中的微卫
目的:本研究探讨静脉注射神经干细胞(NSCs)是否能改善缺血性大鼠的神经功能缺损及脑梗塞体积.观察移植的神经干细胞在大鼠脑内的存活,迁移,增殖及分化能力.方法:制备雄性SD大鼠脑缺血再灌注模型,随机分为两组.术后分别给予CM-DiI标记的NSCs和等体积PBS.NSS评分评估神经系统功能恢复情况,TTC(2,3,5—氯化三苯基四氮唑)染色检测脑梗死体积,Brdu(5-溴脱氧尿嘧啶核苷)染色检测细胞
乙偶姻(3-羟基-2-丁酮)是一种常见的食品添加剂,同时作为美国能源部优先开发的平台化合物,广泛应用于制药、化工等领域,通常由化学法人工合成。近年来,随着人们对食品安全和环境保护意识的增强,利用微生物法生产安全天然的乙偶姻越来越受到青睐。经过多年的努力,通过发酵法、酶转化法和生物转化法等技术实现了生产天然乙偶姻的可能性,其中包括肺炎克雷伯菌,芽孢杆菌,类芽孢杆菌,沙雷氏菌和葡糖杆菌等一些细菌均表现
流行病学研究表明H7N9禽流感病毒的传播和活禽贸易之间存在关联。应用大数据技术分析活禽交易的网络数据,可获得活禽贸易信息,进而进行疫情溯源并预测未来传播趋势。为对大数据预测得到的H7N9传播模型进行评价,从流感研究数据库中获取了截止至2013年分离得到的H7N9毒株的血凝素基因核酸序列,使用RAxML软件构建了系统进化树推断2013年上半年疫情中H7N9在各省及城市间的传播情况,并与大数据推断结果
[目的]绿色木霉(Trichoderma viride)是世界上普遍存在的一种好氧异养型真菌,常腐生于木材、种子及植物残体上,是自然界中产纤维素酶活性最高的菌株之一,纤维素酶广泛应用于食品、饲料、医药和纺织业中。绿色木霉自絮凝固定化是在一定的条件下,使绿色木霉自然絮凝形成一定形状的固定化方法,该方法成本低,具有潜在的应用前景。本文运用响应面法优化了自絮凝固定化绿色木霉的培养条件,以便使自絮凝绿色木
目的 对一例脆性X综合征突变嵌合体患儿进行基因诊断分析。方法 疑似患儿存在智力低下等临床表现符合脆性X综合征的临床诊断,提取患儿外周血DNA,采用荧光标记的CGG RP-PCR方法扩增,产物经毛细管电泳检测,分析FMR1基因CGG重复次数;针对FMR1 CpG岛异常甲基化,采用甲基化特异性多重连接依赖性探针(MS-MLPA M029)检测酶切特异性产物。实验设阴性和阳性对照,同时行常规PCR分析进