基于残差网络的跨膜蛋白残基距离预测研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:yuwenhuaji11987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨膜蛋白是存在于生物膜上的一类特殊蛋白质,承担生物膜两侧物质和信息的传导功能,在多种重要的生命过程中发挥至关重要的作用,如物质运输、离子通道、能量传递、信号识别等。由于它们的特异性结构,目前药物市场上约一半以上药物靶点是跨膜蛋白,其结构和功能研究对药物研发具有巨大价值。然而相对于水溶蛋白,生物技术手段难以大规模测定跨膜蛋白结构,虽然近年来样本数量持续增长,但仍然远不能满足相关研究的需要。因此,采用计算手段从蛋白质序列出发精确预测跨膜蛋白特异性结构特征,从而对其进行深入功能研究,这是当前结构生物学领域内一项重要研究问题。蛋白质残基距离预测是根据序列描述其空间结构的一种普遍方法,前期研究主要通过蛋白质序列模式、残基理化属性等作为特征,采用多种机器学习和统计方法进行建模,但由于预测能力有限通常简化为对其中发生分子共价键接触的残基二分类预测问题。随着深度学习技术的发展,近期出现以Alpha Fold为代表的蛋白质结构预测方法则能够对结构样本较多的蛋白质家族取得较好的结构建模,但由于跨膜蛋白同时存在跨膜结构和非跨膜结构,除少量家族外的大量跨膜蛋白结构样本并不充足,仍然存在残基距离预测的应用需求,有待探索针对性的预测方法。本文研究工作面向跨膜蛋白的特殊性,借鉴于水溶蛋白结构预测相关研究方法,分析并提取具有结构显著性的跨膜蛋白特异性序列特征,对与跨膜蛋白功能直接相关的跨膜和表面区域残基,利用残差网络的序列模式学习优势,分别建立深度神经网络模型进行跨膜蛋白残基距离预测。其中针对跨膜蛋白表面残基,提出以压缩激励模块嵌入残差模块的SE-Res为核心块的深度预测模型Sur Res D;针对跨膜蛋白跨膜区残基,提出仅依赖于残差模块的预测模型TMRes D,其残差模块通过融合空间和通道信息来提取特征,压缩激励模块侧重于自动学习不同通道特征的重要性。通过对特征组合方式探索发现,以进化保守性和协同进化特征作为输入时,Sur Res D和TMRes D模型达到了最佳的预测性能,在验证集和独立测试集上两模型的PCC分别达到了0.5212、0.5378和0.5474、0.589。距离阈值分别设置为7?和6.5?时,能使由表面残基距离图和跨膜区残基距离图转换而来的二值残基接触图在评价指标MCC值上达到最大,分别为0.5337和0.4576。综上所述,本文面向残基接触图中发生接触的残基对与非接触的残基对比例失衡问题,转为对蕴含更细粒度信息的残基距离图的研究,分别从模型构建、特征组合、合理设置距离阈值以及模型对比等多个角度进行了一系列探索,所提出的预测方法能够有效拟合及预测残基间距离,不仅可以为跨膜蛋白高质量结构重建提供支持,也有助于探索结构决定的功能和生物学机制,对进一步研究药物分子作用、靶点设计和疾病治疗有推动作用,并为后续相似问题提供研究思路。
其他文献
具有超凡属性的类石墨烯结构的磁性薄膜材料,被认为是理想的半导体材料,在量子芯片领域具有十分广阔的前景。本文在海森堡模型的框架下,研究了“铁磁-反铁磁-铁磁”和“铁磁-铁磁-铁磁”这两种典型的类石墨烯薄膜。论文采用线性自旋波理论,引入推迟格林函数方法,对系统哈密顿量进行了对角化求解。基于谱定理和关联函数,对比研究了交换耦合相互作用、各向异性以及自旋量子数等因素对能隙、共振频率和基态磁矩的影响。研究发
学位
2020年初新型冠状肺炎病毒爆发,迅速蔓延并肆虐全球,疫情持续时间长,对特定人群危害程度大,引起社会各界的高度重视,在各个社交平台关于疫情话题急剧增加。了解大众舆论热点话题,分析人们对各类疫情信息的情感反馈,从而对社会舆情进行正确导向,同样是战“疫”的重要一环。然而,如何有效地对大规模的文本数据进行提取、分析、处理和决策,是舆情监测问题面临的巨大挑战。本研究提出一套面向舆情数据的主题情感演化可视分
学位
免疫信息学是在现代信息学和免疫学的基础上建立的新兴学科,它是一种使用信息学的相关方法理论来处理免疫和疫苗学相关问题的学科,同时也是研究生物免疫应答过程中信号传输规律以及免疫系统调节的学科。作为免疫信息学研究的主要问题之一,表位预测是研究疫苗、抗体、变态反应和移植免疫计算分析的基础。表位是在抗原分子中能够与抗体或受体结合、引发特异性反应,从而引发免疫应答的特殊化学结构。B细胞表位是指抗原表面上,能够
学位
随着现代科技的进步,视频和图像已经成为人们最主要的信息传递方式,如何更好地利用这些信息是一个值得深入探讨的问题。3D人体姿态估计是计算机视觉领域的一项热门研究话题,它是指从视频或图像中估计人体关节点的3D位置。3D人体姿态估计技术拥有十分广泛的应用场景,如人机交互、自动驾驶和视频监控等。但是目前该技术的发展仍然不够成熟,取得的成果距离人们满意的效果还有很大差距。本文研究的主要内容是设计一个深度网络
学位
约20%的人在其一生中都会患有癌症,其中乳腺癌的发病率逐年提高并在新发患者数量和死亡数量上都位居第一。据统计结果显示,45岁到55岁是乳腺癌病症的高发期,早期乳腺癌的治愈率可达到90%,所以越早发现越能提高乳腺癌患者的治愈率。由于传统的乳腺检测方式时间周期长、费用高,所以提高检测速度并降低费用变得越加重要,拉曼光谱作为一种分子散射光谱,能够检测到物质中分子结构和含量的变化,在疾病诊断方面具有一定的
学位
随着科技的不断发展,以物联网、云计算等技术为支撑的大规模开放在线课程正逐渐成为一种大众喜爱的学习方式。在线课程摆脱了传统课堂的时空约束,对学习者的资质限制较少,具有自由、灵活的优势,但是其也面临着管理难以规范化、辍学率高、通过率低等问题。为了提高课程的完成度,研究人员通常基于平台中学习者的历史学习行为数据,采用机器学习模型预测学习者发生辍学的可能性。机器学习模型强大的建模能力,能够实现对学习者学习
学位
人类拥有精确跟随他人视线的能力,这种追随他人视线的能力被称为凝视识别,这种能力可以让人们更好地理解他人的意图,甚至可以预测他们未来的行动。计算机一旦掌握这种能力,就能在多个领域(教育、医疗、智能监控、VR游戏或人机交互领域)为人类提供更方便、更智能的服务。近年来,随着深度学习的不断发展,凝视识别这一基础研究取得了一系列的突破,这无疑推动了计算机视觉的进步。虽然目前大多数凝视识别算法取得了令人印象深
学位
目标检测任务是计算机领域中的一个重要研究分支,涉及的应用领域也十分广泛,例如,医疗影像、智能交通安全等。以智能交通安全领域为例,通过在街道各个角落安装高清摄像头,实时获取街道行驶车辆的交通轨迹,以便及时提醒驾驶人遵守交通规则,避免车祸的发生。目标检测技术已成为生活实际场景中的重要工具。目前,基于深度学习的YOLO目标检测算法系列中,YOLOv4算法在单个GPU上就可完成训练,而且使目标检测的速度和
学位
随着科学技术和共享经济的不断发展,短期租赁服务网站越来越多。Airbnb作为著名的短期租房平台,已经成为了很多年轻人出门旅游住宿的首选。对于租房销量来说,价格因素不可忽视,但是不同于传统酒店业成熟的定价体系,Airbnb平台上租房的定价是由房东自主决定。房东需要为租房制定合适的价格来吸引更多的房客,而房客也需要了解租房合理的价格以防上当受骗,所以租房价格是一个值得研究的问题。早期对于租房价格的研究
学位
随着消费电子产品日新月异的发展以及社会对公共安全的迫切需求,摄像头网络已经从提供静态监视的早期角色,演变为当前的能够获取大量视频信息以进行智能处理的复杂网络系统,而且功能也不再是简单的监控用途,可以为后续的研究提供资源基础,例如目标识别、目标跟踪、姿态估计等。由于摄像头网络的规模逐渐庞大,需要覆盖的区域也更加复杂,如何降低摄像头网络的组网成本及如何提升目标空间的覆盖率已成为迫切需要解决的问题。因为
学位