利用机器学习提高M.jannaschii酪氨酰tRNA合成酶底物特异性分子建模预测的准确度

来源 :生物化学与生物物理进展 | 被引量 : 0次 | 上传用户:sunku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计结合不同化学结构底物的酶结合袋是一个巨大的挑战.传统的湿实验要筛选成千上万甚至上百万个突变体来寻找对特定配体结合的突变体,此过程需要耗费大量的时间和资源.为了加快筛选过程,我们提出了一种新的工作流程,将分子建模和数据驱动的机器学习方法相结合,生成具有高富集率的突变文库,用于高效筛选能识别特定底物的蛋白质突变体.M.jannaschii酪氨酰tRNA合成酶(Mj.TyrRS)能识别特定的非天然氨基酸并催化形成氨酰tRNA,其不同的突变体能够识别不同结构的非天然氨基酸,并且已经有了许多报道和数据的积累,因此我们使用TyrRS作为一个例子来进行此筛选流程的概念验证.基于已知的多个Mj.TyrRS的晶体结构及分子建模的结果,我们发现D158G/P是影响残基158~163位α螺旋蛋白骨架变化的关键突变.我们的模拟结果表明,在含有687个突变体的测试数据中,与随机突变相比,分子建模和打分函数计算排序可以将目标突变体的富集率提高2倍,而使用已知突变体和对应的非天然氨基酸数据训练的机器学习模型进行校准后,筛选富集率可提高11倍.这种分子建模和机器学习相结合的计算和筛选流程非常有助于Mj.TyrRS的底物特异性设计,可以大大减少湿实验的时间和成本.此外,这种新方法在蛋白质计算设计领域具有广泛的应用前景.“,”Design of enzyme binding pocket to accommodate substrates with different chemical structure is a great challenge.Traditionally,thousands even millions of mutants have to be screened in wet-lab experiments to find a ligand-specific mutant and large amount of time and resources are consumed.To accelerate the screening process,we propose a novel workflow through integration of molecular modeling and data-driven machine learning method to generate mutant libraries with high enrichment ratio for recognition of specific substrate.We collected all the M.jannaschii tyrosyl-tRNA synthetase (Mj.TyrRS) mutants reported in the literature to compare and analyze the sequence and structural feature and difference between mutant and wild type Mj.TyrRS.Mj.TyrRS is used as an example since the sequences and structures of many unnatural amino acid specific Mj.TyrRS mutants have been reported.Based on the crystal structures of different Mj.TyrRS mutants and Rosetta modeling result,we found D158G/P is the critical residue which influences the backbone disruption of helix with residue 158-163.Our results showed that compared with random mutation,Rosetta modeling and score function calculation can elevate the enrichment ratio of desired mutants by 2-fold in a test library having 687 mutants,while after calibration by machine learning model trained using known data of Mj.TyrRS mutants and ligand,the enrichment ratio can be elevated by l 1-fold.This molecular modeling and machine learning-integrated workflow is anticipated to significantly benefit to the Mj.tyrRS mutant screening and substantially reduce the time and cost of wet-lab experiments.Besides,this novel process will have broad application in the field of computational protein design.
其他文献
[目的]研究不同激素组合对甘草愈伤组织形成的影响,诱导甘草胚性愈伤组织的分化与增殖.[方法]以甘草种子为试验材料,通过种子发芽率比较,筛选出发芽率最高的浸种条件.利用植物组织与细胞培养技术,进行愈伤组织诱导与增殖研究,通过调节激素组合对甘草愈伤组织形成的影响进行研究.[结果]浸种40 min条件下,种子发芽率最高达64%;下胚轴为最适合诱导愈伤组织的外植体;MS+6-BA 1.0 mg/L+NAA2.0 mg/L为甘草愈伤组织增殖培养最适培养基;MS+NAA 2.0 mg/L+6-BA 0.5 mg/L有
[目的]在长期堆放羽毛的家禽屠宰场取样,透明圈法筛选角蛋白酶高产菌株.[方法]以羽毛粉为唯一碳氮源进行初筛,再以脱脂牛奶为唯一碳氮源进行复筛,根据透明降解圈与菌落直径比的大小,筛选角蛋白降解能力较强的菌株,并对其进行菌株鉴定,结合酶活测定优化发酵条件.[结果]筛选得到一株角蛋白酶高产菌株B9,测定16S rDNA序列及生理生化特性分析,鉴定为粘质沙雷氏菌;结合酶活测定对其进行碳氮源、发酵温度、pH及发酵周期等条件优化,该菌株酶活力达到681.6 U·mL-1,为优化前的4.75倍.[结论]在家禽屠宰场取样
[目的]探讨羟基积雪草甙介导NLRP3信号通路治疗痛风性关节炎的分子机制.[方法]8周龄SPF级Wistar大鼠依次分为对照组(10只,注射等量生理盐水后再经右踝关节注入PBS溶液)、模型组(10只,注射等量生理盐水后再经关节腔注入浓度为80 mg/mL的MSU混悬液)、实验组(分别注射10、20、40 mg/kg/d羟基积雪草甙溶液分别作为低剂量组、中剂量组、高剂量组各10只,经关节腔注入浓度为80 mg/mL的MSU混悬液).处死大鼠后获取关节液采用酶联免疫吸附法(ELISA)检测IL-1β、TNF-
从分子层面对泛癌进行研究已经得到了很大的进展,但是对宫颈鳞状细胞癌的分子分类研究仍然需要更多的探索.为了找到宫颈鳞状细胞癌潜在的子类,本文提出了一个基于多维组学数据的癌症亚型分类分析流程.通过统计学方法对癌症基因组图谱(The Cancer Genome Atlas,TCGA)宫颈鳞状细胞癌的mRNA表达数据、小分子核糖核酸(microRNA,miRNA)表达数据、DNA甲基化数据以及拷贝数变异数据4个维度包含的分子进行筛选,然后对筛选后的分类特征进行整合聚类,进一步筛选能够区分不同子类的关键分类特征,并
[目的]研究蝉拟青霉产镇痛组分的最佳液体发酵培养条件.[方法]采用Plackett-Burman试验设计对液体培养基中葡萄糖、蛋白胨、酵母浸膏、KH2PO4和MgSO4以及发酵过程中pH、温度和接种量8个因素进行变量分析,筛选出了重要的影响因子为培养基pH、发酵温度和接种量;通过最陡爬坡试验得到这些因子的最大响应值区域.[结果]应用响应面方法分析得到最佳培养条件为:葡萄糖20 g/L、蛋白胨3 g/L、酵母浸膏2 g/L、KH2PO4 1 g/L、MgSO4 0.5 g/L、pH 7.96、温度16.05
支持向量机(SVM)是统计学理论和最优化交叉融合产生的一类重要的机器学习方法,在文本分类、疾病诊断和人脸检测等领域有广泛应用.损失函数是SVM的核心研究内容,它的变分性质在最优性条件刻画、优化算法设计、支持向量表示以及对偶问题研究中发挥着重要作用.本文总结和分析0-1损失函数及其18种常用的SVM代理损失函数,并给出这些损失函数的三种变分性质:次微分、邻近点算子和Fenchel共轭,其中9种邻近点算子和15种Fenchel共轭由本文给出.
随着电子产品、通讯设施、电力设备等的广泛应用,环境中的电磁场强度日益增大,对蜜蜂的行为、生理、生长发育等都会造成干扰,这已成为影响蜜蜂种群数量的关键因子之一.而目前磁场对蜜蜂的影响相关研究还不充分,相关机制了解也不完全明确,亟待加强研究.该文系统阐释了磁场对蜜蜂在舞蹈语言信息传递、行为、生长发育和生理状态等方面影响,并对蜜蜂体内的磁感受机制、磁场信号的转导和传递,以及其相关生物学效应发生的分子机制等方面研究进行综合阐述,为后续研究和应用提供参考.
[目的]通过多种生物信息学手段分析骨膜蛋白POSTN在肺鳞癌(Lung squamous cell carcinoma,LUSC)中的表达、临床意义及可能机制.[方法]①通过cbioportal数据库分析POSTN在不同肿瘤组织中的表达情况.②通过GSE数据集分析POSTN在不同非小细胞肺癌(Non-small cell lung cancer,NSCLC)中的表达差异.③通过Oncomine数据库分析POSTN在LUSC组织中的表达情况.④通过GEPIA数据库分析POSTN在LUSC组织中的表达及与患者
该文综述了剪接体复合物组分SF3B1编码基因突变对真核细胞mRNA可变剪接的影响及临床意义.文章总结了 SF3B1突变引起的蛋白结构变化,分析了突变对mRNA剪接过程影响的分子机理.由于SF3B1在骨髓增生异常综合征,慢性淋巴细胞白血病,乳腺癌,葡萄膜黑色素瘤中的突变率较高,该文总结了在上述疾病中SF3B1基因突变对临床病人的影响并分析了突变对其它基因mRNA可变剪接的影响.SF3B1作为mRNA剪接的重要调控蛋白有望成为未来抗癌药物设计、疾病治疗的新靶点.
斑马鱼是一种新型脊椎类动物模型,现已广泛运用于人类相关疾病研究.其具有实验操作简单、适用于高通量药物和相关致病基因筛选以及遗传操作系统成熟等特点.斑马鱼作为一种理想的人类血液疾病模型,其造血系统与人类的造血系统在进化和功能上是一致的.该文以斑马鱼模型在研究血液系统肿瘤疾病中的优势为出发点,概述了斑马鱼血液系统肿瘤疾病模型的建立与应用,为研究血液肿瘤疾病的致病机理,以及抗血液肿瘤疾病药物筛选研究提供参考.