【摘 要】
:
蛋白质结构预测是分子生物学界一个重要的研究课题,其本质工作是通过序列数据库中的氨基酸序列数据来预测其对应的蛋白质结构的三维坐标。蛋白质功能以及蛋白质之间的相互作用都依赖于蛋白质结构的信息,在医学研究,制药领域都有着重大的意义。蛋白质结构优化作为蛋白质结构预测的重要步骤,其目的在于将初始预测的粗糙的蛋白质结构在局部进行优化得到质量更高的预测结构。目前,蛋白质结构优化主要采用单一蛋白质能量函数结合蒙特
论文部分内容阅读
蛋白质结构预测是分子生物学界一个重要的研究课题,其本质工作是通过序列数据库中的氨基酸序列数据来预测其对应的蛋白质结构的三维坐标。蛋白质功能以及蛋白质之间的相互作用都依赖于蛋白质结构的信息,在医学研究,制药领域都有着重大的意义。蛋白质结构优化作为蛋白质结构预测的重要步骤,其目的在于将初始预测的粗糙的蛋白质结构在局部进行优化得到质量更高的预测结构。目前,蛋白质结构优化主要采用单一蛋白质能量函数结合蒙特卡洛算法或者分子动力学模拟算法在蛋白质构象空间中进行搜索。这类型的算法存在着两个缺陷,一个是目前的领域内没有一种蛋白质能量函数能够准确地适配所有的蛋白质,采用单个的能量函数可能造成对蛋白质描述的片面性,造成优化效果出现偏差。另一个是这些算法通常采用一个初始结构作为基础在分子动力学模拟中迭代,这样的方式导致优化结构的质量会受到该初始结构的制约。当初始结构质量较差时,优化算法的效果也不会太理想。针对以上两个缺陷,本文提出了面向蛋白质三位结构优化的多目标群智能算法AIR。其核心思路是利用多种能量函数替代传统分子动力学模拟方法中单一能量函数,并且采用多个初始结构作为输入,在使得蛋白质搜索空间增大的同时,利用群智能粒子群算法的信息共享机制来学习各个初始结构之间的高质量局部结构,最后利用蛋白质结构特性采用聚类与边际效应联合的方式对候选蛋白质结构进行筛选。AIR算法由三个部分组成:(1)算法采用多个不同的初始结构作为初始模型,通过随机扰动产生定量的不同结构的粒子;(2)采用基于多目标的群智能算法作为蛋白质构象空间的搜索算法,利用非支配关系衡量不同结构之间的优劣;(3)最后一步是对候选结构进行排序筛选,首先通过聚类算法在能量空间对结构进行聚类,之后对于每一个簇使用边际效应算法进行排序,从不同的簇中选择出最终的优化结构。在实验方面,本文在由CASP11与CASP12构建的目标蛋白质测试集上进行了多方面的实验,并通过与领域内的优秀蛋白质结构优化算法的对比试验证明了经过AIR算法优化后的目标蛋白质在RMSD、TM-score、GDT_TS等蛋白质无参考评价指标上相比于初始结构与其他算法的优化结构有了很大提升。此外,在CASP13的蛋白质结构优化竞赛中,AIR算法也取得了不错的成绩。最后,作者搭建了一个AIR软件的下载更新平台。旨在让领域内其他科研人员能够了解到这种基于多目标优化思想的蛋白质结构优化算法并且能够方便算法版本更新。
其他文献
目的对新型冠状病毒肺炎疫情防控环境下感染科工作人员的心理健康进行调查并分析其应对措施。方法采用随机抽样法选取本院感染科工作人员60名,利用本院自制一般资料调查表、大型公共卫生事件发生时心理问卷以及简易应对方式问卷对其进行调查。结果新型冠状病毒肺炎疫情防控环境下感染科工作人员心理健康状况各维度评分明显高于中国常模(t=2.298、2.381、3.055、2.193、2.274,P<0.05);男性工
生物识别技术以其高安全性和便捷性,在移动终端中的应用越来越普遍。在这些技术中,指纹识别有体积小和成本低的优势,因此应用最为广泛。指纹传感技术主要有电容式、光学式和超声波式三大类。最近,随着用户对高屏占比和“全面屏”的显示需求增长,原有的电容式指纹传感模块由于不透明和不兼容显示等缺点而被厂商舍弃使用。随后,光学式和超声波式屏下指纹传感技术被迅速研发,但现有光学式只能在OLED屏幕下的固定区域进行识别
卫星在轨长期管理(长管)数据是卫星状态的一种反映。卫星运行到地面测控弧段时,地面接收卫星遥测系统下传的遥测数据,数据中包含与各子系统及卫星载荷相关的遥测参量数据,反映出显现及隐含的卫星自身状态信息及宇宙环境信息等。实时以及延时遥测数据中包含异常数据,其中一部分为错误数据,一部分为故障数据。导致卫星遥测数据异常的原因主要有如下几种:未提前通知的基地人为操作、卫星自身或装载的有效载荷运行状态异常、遥测
5G如今已经正式进入商用阶段,其高速率、低时延的性能指标也促使着基带通信技术的发展。极化码作为华为公司主推入选的5G控制信道编码方案,在理论上证明了可以达到香农限,具有优异的误码性能。传统的极化码译码算法伴有复杂的节点计算和高延时的译码结构,虽然在短码的控制信道上还可接受,但也制约了极化码向长码的数据信道上的进一步发展,因此如何改进极化码的译码方法是一个亟待解决的问题。此外5G应用场景的多样化也使
尽管深度学习在各种任务中取得了优越的效果,研究人员发现深度网络模型实际上容易受到对抗样本的攻击。对抗样本是指在自然图像中加入一个微小的扰动,导致深度模型给出错误的预测,从而形成一种对模型的攻击。对抗样本的存在对深度学习的应用造成了威胁,因而引起了广泛的研究兴趣。本文分别面向对抗攻击和对抗防御,探索了如何基于深度模型的中高级特征来设计算法。在攻击方面,本文提出了一种生成式可迁移对抗攻击(Genera
随着信息技术的高速发展以及集成光学相关研究的不断深入,集成光学传感器凭借其灵敏度高、集成度好、体积小、重量轻等优势,正逐渐成为光传感领域的研究热点。硅基微环谐振器作为一种典型的微型集成光器件,具有Q值高、易级联、体积小、易于实现批量化生产等特点,在高速光通信及新型光传感领域都具有良好的应用前景。另一方面,折射率传感技术在食品安全检测、化学物质标定、生物医学以及环境状况检测等领域都具有重要的应用,通
近年来,随着机器学习与深度学习技术的发展,计算机视觉与图像处理技术也得到了迅速的发展。医学图像分析,作为一个传统的计算机视觉的分支,在医学诊断中具有重大的意义。本文的目的在于介绍深度学习算法在不同医学图像中的应用。这些应用,可以作为计算机辅助系统,解决实际中的医学问题。由于医学图像分析的范围较广,通常包括分类、分割、检测、配准等,本文着重研究深度学习算法在医学图像分割中的应用问题,即辅助医生进行快
近年来,由于相关材料和工艺技术的发展,压力传感器得到了广泛地研究。因为其能定量测量空间接触力分布以及易于柔性集成,压力传感器在智能机器人、仿生假肢、人机交互等领域应用中尤为重要。特别是压力传感阵列,凭借其能够提供更丰富的数据特征进而实现更精确的功能,有着非常重要的应用前景。压力传感阵列可以根据其工作原理分为若干类别,而电容型的压力传感阵列则是其中最为常见且简单的一种。它可以以非常简单的结构实现较低
随着现代医疗技术的不断进步,医学图像数据量在持续快速增长,这使得计算机辅助的医学图像分析算法引起了学术界以及工业界的广泛关注。其中医学图像分割在病变组织的定位、解剖结构的学习等多种情况下有着巨大的应用需求。如何利用特定医院标注的有限数据训练高性能的分割模型仍然是医学图像分割中重要的研究任务。在实际使用过程中,医生标定数据的成本十分昂贵且耗时,且大量的无标签数据无法有效加入模型训练。为了应对这种情况