数据驱动的蛋白质主链从头设计及实验验证

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zhenyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多肽主链结构的可设计性是指是否存在能自发、稳定地折叠成该主链结构的氨基酸序列。由数十到数百个氨基酸组成的蛋白质,其主链三维结构有近乎无穷多的可能性,其中绝大部分不具有可设计性。从头设计蛋白质的难点在于人工产生可设计性高的主链结构。本文的目标,是发展计算模型,通过对主链结构的连续自动优化获得高可设计性的主链,并进行实验验证。为此目的,本文采用数据驱动方法,基于当前PDB数据库中的大量天然蛋白质结构数据,构建了统计能量函数SCUBA(SideChain Unknown Backbone Arrangement)。SCUBA的核心思想是用人工神经网络来准确刻画高可设计性主链结构中各类高维度的相关性;训练神经网络所需的数据则来源于用近邻计数(neighbor counting)方法对数据库中各类三维结构元素进行统计分析得到的定量结果;各神经网络能量项的计算能快速且可解析求导,可以用各类基于梯度或力的模拟优化算法进行结构采样和优化。本文对33个天然蛋白的主链结构用SCUBA能量函数进行随机动力学模拟和测试,校准了各统计能量项的相对权重,并验证天然蛋白主链结构在SCUBA能量面上是稳定的。为了测试用SCUBA从头设计的主链结构的可设计性,本文参照天然蛋白质折叠中常见的α/β分层排列的折叠类型,定义了 12种在二级结构单元的排列方式或长度方面互有区别的主链框架,通过模拟煺火优化得到SCUBA能量优化后的主链结构。在天然蛋白结构数据库中的搜索表明对大部分SCUBA优化的主链,都能够找到与之高度相似的天然结构。这表明通过优化SCUBA能量得到稳定结构可以获得可设计性高的主链结构。为了实验验证通过优化SCUBA能量获得的主链可以进行氨基酸序列设计,本文使用固定主链的序列设计方法ABACUS对前述优化得到的主链进行序列设计,并进行若干轮序列设计-主链优化-序列设计的迭代。初始获得的序列能实验表达的比例很低,对个别能表达的蛋白进行进一步实验也未能获得适合结构解析的样品。对设计流程的进一步分析表明前述过程未能充分优化连结二级结构的环区(loop)的主链结构,可能因此降低了整体主链结构的可设计性。基于此假设,结合环区采样闭合算法和SCUBA对每个环区的起始位置、长度、主链结构分别优化,重新获得环区也充分优化的主链结构。本工作对这些主链结构重新设计序列,合成了 30条编码不同人工蛋白的基因,成功纯化了 8个可溶性表达的人工蛋白,随后进行的结晶实验中有5个蛋白形成了晶体,最终对2个状态良好的蛋白晶体进行了结构解析,其余晶体仍需优化。已解析出的晶体结构与设计结构高度相似,主链RMSD分别为1.01 (?)和0.85 (?)。需要特别指出的是,两个结构中10个环区有9个的实验结构与设计结构的RMSD在0.9 (?)以内。在以上主链设计优化以及环区优化过程中,没有考虑序列(侧链)信息。本文得到的实验结果以及课题组的其他实验结果均表明,SCUBA能够在氨基酸序列待定、不使用天然蛋白主链片段拼接的前提下,通过自动优化的方法从头设计获得具有高可设计性的多肽主链结构,并经过后续氨基酸序列设计获得能折叠成预期结构的人工蛋白。SCUBA+ABACUS提供了一条从头设计蛋白的新途径,为在更少受到设计方法约束的前提下进行功能蛋白的从头设计奠定了基础。
其他文献
铝基非晶合金比传统的铝合金具有更高的比强度、耐蚀性、耐磨性和耐热性等性能,是一种极具应用前景和发展潜力的先进材料。研究铝基非晶合金体系、揭示其非晶形成机制,对于铝基非晶合金的发展是非常重要的。机械合金化方法制备非晶合金粉末,具有设备和工艺简单、成本较低、容易操作等特点,是形成铝基非晶合金粉末最有效的方法之一。机械合金化方法结合粉末冶金工艺,已被证明可制备出大尺寸块体非晶材料或复合材料,这使铝基非晶
学位
本文对具有物理、生物、医学等背景的非线性偏微分方程(主要是反应扩散方程)的行波解及传播现象进行分析.研究内容包括以下四部分.在第一部分,我们考虑了一类具有点火温度动力学的预混火焰模型,该模型描述了厚火焰的动力学并区别于经典的Arrhenius动力学.当Lewis数很大时,会观察到脉冲不稳定性,我们试图用数学方法对其进行刻画.我们将火焰视为自由交界面问题中要确定的交界面,将其转化为完全非线性的抛物方
学位
近现代物理学中的经典问题均可借助微分方程模型来刻画并获得较好地解决.在此过程中,数学中的微分方程及相关的非线性泛函分析等研究获得了长足的发展,产出了一系列具有深远影响的研究结果.其中,半线性椭圆型方程及其相关的临界点理论是近年来国内外研究的热点方向.具有代表性的半线性椭圆型方程包括源于量子力学中的非线性薛定谔方程模型,量子化学中的多体问题模型以及震动问题中的K-G模型等.有较强应用背景的椭圆问题的
学位
本论文的重点是通过实验研究超冷锶原子气体中的里德堡激发。里德堡原子相比基态原子有极强的长程偶极相互作用,且在电场或者磁场中有非常大的可调谐性,这使得里德堡原子成为量子模拟和量子信息研究中非常好的研究对象。碱土金属系列的锶元素,两个价电子的电子结构使得锶原子有不同于碱金属元素的kHz量级和mHz量级的钟态光跃迁。这种窄跃迁不仅使得锶原子可以简便有效地通过激光冷却下来,也使得原子可以通过亚稳态的中间态
学位
材料是限制未来热核聚变应用的关键因素之一。在未来聚变堆如ITER(International Thermonuclear Experimental Tokamak)和 CFETR(China Fusion Engineering Test Reactor)运行时,聚变等离子体与壁材料将发生强烈的相互作用(PWI,Plasma-Wall Interactions)。面对聚变堆边界等离子体大于 1×1
学位
目的 对中国典型农作物大米和蔬菜重金属/类金属污染状况及其引起的健康风险进行评估,筛选甄别需要重点关注的地区、重金属/类金属元素和敏感人群。方法 基于2002—2020年相关文献资料,综合运用地理信息系统分析、健康风险评估等方法,分析农作物的重金属/类金属超标率、空间分布差异、健康风险值。结果 大米中Pb、Cd、Hg和As含量的中位值分别为0.07、0.06、0.01和0.10 mg/kg,超标率
期刊
众所周知,Plasmoid不稳定性(PI)是在外部驱动的Sweet-Parker(SP)重联期间形成的拉长电流片上发展起来的,或者内部生长的非线性扭曲模或撕裂模中发展起来的。一般来说,如果拉长电流片的纵横比变得足够大,不稳定的次级撕裂会导致等离子体团的形成。从层重联(到早期非线性阶段)过渡到随后高度不稳定的层重联阶段,其特点是在电流片内部零星地产生等离子体团,平均重联速率更快,这个问题已通过一些过
学位
5G网络和智能物联网在智能工业控制、军事以及民用领域都得到了广泛的应用。在以超高节点密度和实时可靠快速通信为特点的5G网络时代,无线网络应用对于网络空间复用、通信时延、网络吞吐量以及节能等问题都提出了前所未有的挑战,亟需开展新型研究机制,为5G协议的制定提供理论性指导。其中,链路调度是无线网络中的一个基础性问题,对提高无线网络的性能起到至关重要的作用。无线信号固有的广播特性导致无线信号在传播过程中
学位
随着托卡马克装置运行参数的提高,新经典撕裂模是不可避免的宏观磁流体不稳定性。新经典撕裂模的产生将严重限制装置的β阈值,并且新经典撕裂模磁岛的产生会改变托卡马克内局部磁场位形,破坏局部等离子体平衡,增强等离子体的径向输运,严重时会导致等离子体破裂,放电中止,甚至损坏等离子体第一壁。经过几十年的研究,探索出了多种避免和控制新经典撕裂模的方法。理论上在磁岛内产生同向的驱动电流是一种有效的控制方法,如电子
学位
目的 探讨多层螺旋CT(MSCT)联合血清血管内皮生长因子-C(VEGF-C)、血管生成素-2(Ang-2)在胃癌淋巴结转移诊断中的应用。方法 选取2016年7月至2021年2月于我院收治的102例经病理诊断证实的胃癌患者作为研究对象,对所有患者均行MSCT扫描和病理组织学检查,依据病理诊断有无淋巴结转移将102例胃癌患者划分为转移组和未转移组,比较两组术前MSCT检查的血容量(BV)、对比剂平均
期刊