一种基于图论的计算蛋白质数据库代表序列的算法

来源 :计算机与应用化学 | 被引量 : 0次 | 上传用户:rongerxingfu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
许多生物序列数据库中都含有大量的冗余序列,这些冗余序列通常不利于对数据库的统计分析和处理,而且它们要占用更多的计算机存储和处理资源.针对这个问题,本文中我们设计了一种去除蛋白质冗余序列的算法.该算法基于图论最大独立集的概念来生成非冗余序列集合,对目前存在的不少蛋白质去冗余程序所采用的由Hobohm和Sander最早设计的一种首先将序列分成若干簇然后取出代表序列的算法进行了改进,使得生成了更多的非冗余代表序列集合,避免了一些非冗余的序列也被去除.我们开发出了实现该算法的程序FastCluster,可以用来去除蛋白质数据库中的冗余序列.
其他文献
期刊
在社会与科技发展的过程中,为了满足发展需求,档案管理工作受到广泛关注与应用,传统的档案管理方法已经无法满足当前的工作要求,应对其进行创新,树立正确观念,合理使用先进的
033经食管二维超声心动图测定成人二尖瓣狭窄的瓣口面积[StoddardMF等.AmHeartJ,1994,127:1348(英文)]经胸廓二维超声心动图是测量二尖瓣狭窄瓣口面积的可靠而精确的方法。经食管二维超声心动图测量二尖瓣口面积的有效
STI测定对充血性心力衰竭患者的评估袁彩华(铁道部第20工程局中心医院咸阳712000)心脏充血性心力衰竭(CCHF)是临床工作中常遇到的问题。本文对CCHF患者进行心脏收缩时间间期(STI)测定,对心力衰竭程度予以量
杂合性急性白血病1例报告顾立达,艾孜买提,孔佩艳,赵勤(第一附属医院儿科)杂合性急性白血病(Hybridacuteleukemia,HAL)是指具有两种或两种以上的白血病细胞特征的急性白血病,临床上较为少见,现将我科收治1例报告
针对性能随时间衰减的锅炉蒸汽系统的循环调度问题进行了研究.首先建立了描述该问题的混合整数非线性模型;然后提出了确定各锅炉循环运行状态的时间分段策略以简化问题的求解
064 心绞痛患者的新特点[Pepine CJ等.Am JCardiol,1994,74:226(英文)]过去认为典型心绞痛好发于中年人、劳力性为主,多无合并症。但由于疾病、人群的变异,诊断标准的完善,治疗的干预等因素导致心绞痛患者的发病特征
期刊
期刊
教材是教师教学、学生学习的主要依据。在新课标的指引下,学校可以自由选择教材,但这并不意味着就可以弱化教材的作用。在现行情况下,教材仍是学生获得系统知识、发展智力、提高