【摘 要】
:
近年来,由于RNA的三维结构数据增长较为缓慢,人们对RNA的生物功能机制无法得到进一步了解,并且也影响了靶向RNA的小分子药物的研发。因此,急需开发优秀的计算方法来预测RNA三维结构。但是目前,RNA的三维结构预测仍是一个巨大的挑战。因此,鉴于蛋白质三维结构预测领域的研究,本文首先利用已有的三维结构数据专注于RNA的三维结构特征与功能预测。本文主要开发了两个RNA结构特征预测算法和一个RNA功能预
论文部分内容阅读
近年来,由于RNA的三维结构数据增长较为缓慢,人们对RNA的生物功能机制无法得到进一步了解,并且也影响了靶向RNA的小分子药物的研发。因此,急需开发优秀的计算方法来预测RNA三维结构。但是目前,RNA的三维结构预测仍是一个巨大的挑战。因此,鉴于蛋白质三维结构预测领域的研究,本文首先利用已有的三维结构数据专注于RNA的三维结构特征与功能预测。本文主要开发了两个RNA结构特征预测算法和一个RNA功能预测算法。对于RNA结构特征预测,基于深度学习算法,本文分别开发了一个新的RNA溶剂可及面积预测法RNAsol和一个新的RNA核苷酸接触图预测方法RNAcontact。对于RNA功能预测,本文开发了一个新的RNA小分子配体预测算法RNALigands。首先,本文的RNA溶剂可及面积预测方法RNAsol是一个基于长短时记忆神经网络的深度学习预测模型。本方法利用改进的多重序列比对构建了RNA的位置特异性矩阵,并添加了相应核苷酸的背景频率来表征RNA。测试表明,RNAsol在蛋白质结合的RNA和无蛋白质结合的RNA的数据集上的预测精度达到了0.43和0.26,相比此前唯一方法高出26.5%和136.4%。当训练集扩大到包括两种类型的RNA时,蛋白质结合的RNA和无蛋白质结合的RNA的预测精度分别增加到0.49和0.46。RNAsol的精确度的提升主要归因于两个方面,包括改进的RNA位置特异性矩阵和长短时记忆神经网络的构建与优化。其次,本文的RNA核苷酸接触图预测方法RNAcontact是一个基于残差神经网络的深度学习预测模型。本方法是首个根据多重序列比对构建了RNA的协方差特征,然后将RNA二级结构与之合并作为神经网络的输入特征。实验表明,在独立测试集上,RNAcontact在top L/10和top L(其中L是RNA的长度)的预测精度分别达到了0.8和0.6,远高于其他基于协同进化的方法。经分析表明,大约有1/3正确预测的核苷酸接触不是二级结构意义上的碱基配对的,这对确定RNA三维结构至关重要。此外,本文证明了预测的核苷酸接触可用作距离约束,以指导RNA三维结构建模。测试表明,与不使用核苷酸接触的模型相比,使用预测的核苷酸接触可以建立更准确的RNA三维结构模型。最后,本文的RNA小分子配体预测算法RNALigands是一个数据库搜索算法。首先,本方法建立了第一个RNA motif和小分子配体互作用数据库。然后,本文提出了motif提取算法和motif比对算法。基于这些,本文开发了RNA小分子配体的搜索预测算法。该预测算法以输入的RNA序列为基础,预测其二级结构并提取motif,随后通过motif比对算法在数据库中搜索相似的motif,进而得到潜在的输入RNA的小分子配体。本文通过测试α-突触核蛋白m RNA的5’UTR序列并找到潜在的小分子配体证明了算法的实用性。
其他文献
由于可以快速制造复杂金属零件,激光选区熔化(Selective Laser Melting,SLM)成形技术的应用前景十分广阔。然而,SLM成形过程中的高温度梯度诱导的零件高残余应力、变形甚至是开裂问题,严重地阻碍了该技术的工程应用。目前对于SLM成形过程中应力的分布和演化及其导致的变形还缺乏系统研究,特别是构成航空航天构件的典型结构的应力及变形研究还几乎是空白。本论文采用有限元数值模拟的方法,系
在过去的几十年中,金属-有机框架(metal-organic frameworks,MOFs)作为晶态材料,由于其独特而多样的多孔结构和功能性受到越来越多的关注。它们在气体存储和分离,非均相催化,传感器,药物输送等众多领域中展现了迷人的应用前景。MOFs组成单元中的金属节点和有机配体具有灵活的可调性和可修饰,因而可以设计和合成具有特殊结构和功能的MOFs材料。但是,目前仍然存在诸多的问题,阻碍了这
我国西北地区龙首山成矿带以世界级的金川铜镍硫化物金属矿床闻名于全球,也是我国西北地区一条重要的铀成矿带。该铀成矿带中发育多种类型铀矿床,包括成矿带西段的红石泉伟晶岩型铀矿床,成矿带中段的新水井、岌岭钠交代型铀矿床以及革命沟花岗岩外带型铀矿床,成矿带东段的金边寺淋积型铀矿床。其中新水井和岌岭铀矿床是我国少有的钠交代型铀矿床,也是我国西北地区碱交代型铀矿床的典型代表。对岌岭钠交代型铀矿床开展系统的研究
近三十年以来,二维材料因其奇异的电子性质,光学性质和磁性质等受到广泛关注。随着理论预测和实验合成,新型二维原子晶体材料不断被发现。这些二维材料不仅揭示了深刻的物理机制,而且在下一代信息技术等方面展现潜在的应用前景。比如,单层MoS2薄膜能够实现“开”和“关”的调控,有望应用于场效应晶体管;钛酸锶表面的单层FeSe薄膜具有高温超导特性;单层CrI3薄膜存在长程铁磁序等。这些新奇现象的发现,对进一步理
铁电材料具有可翻转的电极化性质,能用于非易失性存储器、电容器、传感器和执行器等多个领域。多铁材料将多个基本铁序集中到一个材料中,不仅同时具有铁电性、磁性等性质,还能互相耦合,有望实现新器件的新颖应用。传统的铁电或多铁材料主要是钙钛矿块体材料,比如典型的铁电材料Ba Ti O3,多铁材料Bi Fe O3,这些材料普遍带隙较大、迁移率低;而且它们的薄膜材料存在临界厚度效应,在应用于微型化和集成度越来越
混沌在经典动力学中指具有确定性但不可预测的现象,以受经典运动方程支配的轨道长期性行为为特点。在量子力学领域,由于微分方程关于时间为线性,且由于不确定性原理的影响,轨道没有得到良好的定义,不存在严格的混沌现象。量子混沌研究的是经典系统中的动力学行为在所对应量子系统中会有怎样的特征。其中著名的结论有Bohigas-Gianonni-Schmit猜想和Berry-Tabor猜想。它们表明对应于经典动力学
本文主要研究了图的彩虹不连通染色问题。令G是一个非平凡的边染色连通图。一个边割被称作彩虹边割,如果边割中的任意两条边都染不同的颜色。若图G中的任何两个顶点之间都存在一个彩虹边割分离它们,则我们称图G是彩虹不连通的。若图G的一个边染色使得图G是彩虹不连通的,则称这个染色为图G的彩虹不连通染色。对一个非平凡的连通图G,使得图G是彩虹不连通的所需的最少颜色数被称为图G的彩虹不连通数,记作rd(G)。我们
Sylvester建立了高斯系数与二元型的半不变量之间的联系,从而证明了Cayley提出的关于高斯系数单峰性的猜想。Pak和Panova利用对称群表示理论中Kronecker系数的半群性质证明了高斯系数的强单峰性。Reiner和Stanton引入了高斯系数的对称差(?),并利用李代数的表示理论证明了Fn,k(q)在满足k≥2且n为偶数时是对称的单峰多项式。在本论文中,我们引入了杨图的半图这一组合概
蛋白质结构决定其功能,了解蛋白质的结构对蛋白质的靶向药物设计和功能注释有重大意义。然而,通过湿实验技术确定蛋白质结构成本高且耗时,而当前蛋白质结构预测算法的精度仍有待提高。核酸往往通过与其它分子(如蛋白质、金属离子等)的相互作用执行其生物学功能,准确识别核酸与其它分子的结合位点可以加速计算机辅助药物的设计。然而,现有的核酸与其它分子的结合位点预测算法的准确率相对较低。因此,本文针对这两个方面展开了
零和理论是组合数论中一个重要的分支,近年来零和理论发展迅速并且得到了广泛的关注。零和理论的一个基本研究课题是研究具有特定性质的零和子列的存在性条件,由此提出了许多关于有限阿贝尔群的不变量,例如,EGZ-常数、Davenport常数、η-常数等。上个世纪70年代,R.Graham提出研究具有不同长度的零和子列问题。他猜想p阶循环群上的一个p长序列如果有3项两两不同,那么该序列一定包含两个具有不同长度