基于层次混合模型的蛋白质信号肽预测研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:haohaohaobaichi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信号肽是一段出现在蛋白质N端的氨基酸短序列,在跨膜蛋白和分泌蛋白的引导和转移中起关键作用。信号肽的知识在药物设计,疾病治疗和生命活动研究中有重要意义。此外信号肽是亚细胞定位的重要信息,对亚细胞定位研究领域有重要的推动作用。近年来随着蛋白质序列爆炸式的增长和生物信息技术的快速发展,通过蛋白质序列信息预测信号肽及其切割位点成为流行的做法。目前,信号肽自动预测领域面临着两个挑战。其中一个挑战是如何准确的在跨膜螺旋片段中识别信号肽,因为信号肽和跨膜螺旋都包含一段呈疏水性的氨基酸片段,即它们在结构上存在很高的相似性,这容易导致分类器误分。另一个挑战是如何精确地识别信号肽的切割位点,因为人们对信号肽切割位点的知识依然十分有限,并且信号肽长度分布较为分散,所以信号肽切割位点的预测精度不高。为了解决这些问题并进一步提高信号肽识别的性能,我们建立了一个信号肽及其切割位点的预测模型:Signal-3L 2.0。在该模型中,我们采用了自上而下结构的设计思想,并分层对信号肽及其切割位点进行预测。为了判断信号肽存在与否,我们提出了一种融合氨基酸残基和功能性结构域信息进行信号肽预测的方法。实验证明功能性结构域信息可以有效区分跨膜螺旋和信号肽,融合氨基酸残基和功能性结构域信息的预测模型能有效地提高信号肽的预测性能。为了准确识别信号肽的切割位点,我们首先使用统计学规则筛选出一批候选切割位点,然后引入候选切割位点的进化保守性信息来选择最终预测的切割位点。实验证明融合统计学习规则和进化保守信息能显著提高模型对信号肽切割位点的识别能力。Signal-3L 2.0在多个数据集上和现有的常用软件进行了性能比较,实验结果证明它有良好的信号肽及其切割位点预测性能。此外,为了加快研究成果的转化与普及,我们搭建了一个在线网络平台供研究人员实时免费的访问,访问地址是:www.csbio.sjtu.edu.cn/bioinf/Signal-3L/。
其他文献
目的:探讨人脐带间充质干细胞(Human Umbilical Cord Mesenchymal Stem Cells,HUMSCs)在大鼠体内分化为Leydig细胞并治疗雄性性腺功能低下症的可行性。方法:采用贴壁法分离培
在数值分析领域,主流方法为有限元法、有限差分法等基于网格的方法,此类方法经过多年发展已经具备了成熟的理论基础且广泛应用于各种工程领域。在数字图像处理领域,基于网格
轨迹数据是指通过对移动对象运动过程的采样所形成的具有时空特征的数据信息。随着位置采集技术的不断发展和采集设备的大量部署,产生了越来越多的移动对象轨迹数据。这些轨
随着移动互联网的发展,视频编码技术也在不断更新。为了更好地适应网络异构性、终端设备多样性和用户需求差异性,质量可分级高效视频编码技术SHVC应运而生。作为新一代高效视
蛾眼表面有周期性排列的圆锥型突起结构,这种微小结构的尺寸一般小于光波长,所以蛾眼表面是一种亚波长结构。当光入射到这种纳米结构上时,由于光无法“看见”这种亚波长结构,
已发现胚胎干细胞(Embryonic Stem Cells,ESCs)表达谷氨酸和γ-氨基丁酸功能性受体以及其合成和释放的生物元件,但谷氨酸和γ-氨基丁酸本身是否能由ESC释放则需要特异性和灵
我国在十八大以来将经济社会协同发展作为阶段性治理核心。在生态环境保护和可持续发展理念的作用之下,我国基层政府逐步转变治理模式以适应经济社会协同发展的治理要务。我
地源热泵技术作为一种绿色供冷供暖技术,它的一个关键技术参数是土的导热系数。本文使用微生物诱导碳酸钙技术(Microbially induced calcium carbonate precipitation,简称MICP)对细砂进行灌注加固处理以提高土体的导热性能,针对本研究展开了一系列理论与试验研究,得出以下结论:(1)对巴氏芽孢杆菌的影响因素进行研究。微生物诱导碳酸钙沉淀反应中,一定浓度的胶结
关税作为一国贸易政策中最根本、最重要的监管工具,对保护国家经济,增加政府税收,稳定国内市场,促进自由贸易发展具有重要意义。目前,中国是乌干达第三大贸易伙伴国,乌干达是
随着我国经济的快速发展,常规化石能源不断被消耗,加快页岩气等非常规油气的开发利用成为重要选择。然而页岩气开发需要消耗大量的水资源,为确保页岩气开发过程中可利用水资