基于深度注意模型的药物蛋白质关系预测

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:sdausunyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物-靶标蛋白关系(DTR)预测分为药物-靶标蛋白相互作用(DTI)分类与药物-靶标蛋白关系亲和力(DTA)回归,它是现代药物发现和药物设计的关键,并为药物副作用研究、药物重定位以及个性化治疗提供方向和有价值的参考。化合物与蛋白质的种类数目庞大,基于生物实验的传统DTR预测方法费时、费力、开销巨大,且具有高失败率。计算机辅助的DTR预测方法具有缩短药物研发时间、减少新药研制的盲目性、降低研发成本等优点,受到越来越多研究者的重视与探索。目前计算型的DTR预测方法有很多,主要有相似性搜索的方法、分子对接技术和机器学习方法等。这些方法需要以化学与生物专业知识为背景且具有各自的局限性,在处理复杂多样的生物信息数据时效果往往不尽人意。随着计算机科学的飞速发展,相关数据库的不断完善和计算机硬件条件的不断提高,深度学习在生物计算领域得到了广泛的应用,为识别DTR提供了新的可能性。具体研究内容如下:(1)在药物-靶标蛋白关系相互作用(DTI)分类问题上,提出一种端到端的基于图注意卷积和交叉注意力机制的药物蛋白质二元关系预测模型。该模型以药物的图结构与蛋白质的氨基酸序列为输入,使用子图构建方法与“词”编码强化药物与蛋白质的表示。模型利用图注意力卷积模型提取药物特征矩阵,该图注意力卷积模型利用注意力机制动态地计算药物原子之间的关系;使用一维卷积神经网络提取蛋白质特征矩阵;通过交叉注意力机制得到两个特征矩阵之间的注意力分数,以此凸显药物子结构与氨基酸子序列的重要程度,提高模型的分类能力。最后,本文通过可视化注意力分数分析模型在生物学上的指导意义。(2)在药物-靶标蛋白关系亲和力值(DTA)回归问题上,本文提出一种端到端的基于卷积神经网络和协同注意力机制的药物蛋白质亲和力值回归模型。该模型以药物的SMILES序列与蛋白质的氨基酸序列为输入。模型通过两个不同的一维卷积神经网络模块分别提取药物与蛋白质的特征矩阵,利用协同注意力机制强化不同的语义信息在模型中的重要程度,提高模型的拟合能力。最后,本文通过可视化注意力分数分析模型在生物学上的指导意义。
其他文献
华北落叶松是我国重要的人工林资源,对防风固沙和固碳增汇起着重要作用。本研究以山西太岳山不同密度、林龄的华北落叶松人工林为研究对象。选取四种不同密度林分,间伐强度分别为0%、15%、35%、50%,选取30a、40a、50a的华北落叶松纯林和15a、26a和40a的华北落叶松混交林。通过探究不同林分土壤团聚体含量占比,解释土壤团聚体稳定性和团聚体内有机碳、全氮、全磷的分异规律,阐述土壤中各级团聚体与
随着经济的发展,工业化的推行形成生产要素的空间聚集从而带来城镇化现象。早期,我国空间城镇化发展迅速,但没有产生相应的人口城镇化。面对这一现状,党的十八大提出新型城镇化,强调以人为核心,实现从产业支撑、人居环境、生活方式等方面由乡到城的转变,最终实现人口的城镇化。新型城镇化建设过程中,基础设施的建设及产业结构升级等方面都需要大量的资金支持,仅靠财政支持显然不够。此时,金融体系能通过其资源配置、风险管
白带显微图像中白细胞的数量可以提示阴道炎症的严重程度。目前对白带中白细胞的检测主要依靠医学专家们的人工镜检,这种人工检查耗时、昂贵且容易出错。近年来,有研究提出基
本文以华北落叶松密度调控样地为调查对象,于2015年5月份-10月份的月初和月末,采用LI-8100 土壤碳通量测量系统对12块样地进行“原状呼吸、去除凋落物呼吸、去除凋落物切断根系呼吸”以及5cm以下土壤温湿度进行测量,2018年在原测量基础上添设“加倍凋落物呼吸”的测量。旨在研究不同间伐强度下生长季土壤呼吸及组分的变化规律和环境因子的影响机制,对今后合理有效的森林经营管理具有重要意义,为进一步
在我国城市化发展步伐不断加快的过程中,很多城市建设都需要大量土地,由此所进行的征地拆迁可以说是现代城市化发展下的产物。征地拆迁作为城市化进程中的重要工作,影响着经
现代社会的发展伴随着大量数据的产生,数据量之大已对现有的计算力和传统的数据分析算法提出了挑战,因此能够在可接受的时间内完成对大规模数据的数据分析任务是一个有重要意
目的探讨BOLD-MRI和DTI-MRI评价中药糖肾方治疗早期糖尿病肾病模型大鼠的效果可行性和实效性,旨在为早期糖尿病肾病的中医药疗效评价提供无创的影像学检查方法,为复方中药疗效的评价提供新的思路和方法。材料与方法35只雄性SD大鼠随机分为空白组5只,模型组30只。模型组采用高糖高脂饲料喂养联合低剂量链脲佐菌素(40mg/kg)腹腔注射诱导糖尿病肾病。最终成模24只,再将其随机分为实验组12只和对
近年来,人脸识别技术日益普及,在国家安全和社会管理方面发挥着越来越重要的作用。但是,人脸暴露在外界中,容易被别人获取,特别是有些别有用心的人会以照片等形式来攻击人脸
大型曲面构件是满足汽车、船舶、高速列车、航天器等重要现代化设备的空气动力学、流体力学方面特定性能的基石,针对大型曲面零件的三维信息提取与应用是曲面产品数字化设计及制造的支撑技术。本文结合高速列车车身段曲面加工质量检测的项目,研究开发了基于2D视觉传感器的大型曲面检测系统,用于实现大型曲面的自动化测量。本文针对曲面测量技术要求和工业生产环境,设计了基于2D视觉传感器的大型曲面检测系统的整体架构。根据
库仑应力变化是研究地震应力触发、断层应力状态变化的一项有效的途径,前序地震引起的断层面上的库仑应力累积变化,对后续地震的时空分布有着直接影响。因此,研究断裂带地震库仑应力累积状况对于这个区域地震长期危险性研究有着重要的科学意义。阿尔金断裂带位于青藏高原西北缘,是一条包含多条断层段的巨型断裂带,是我国强震活动最为频繁的区域,而目前7级以上地震离逝时间已经接近或超过历史地震复发周期,具有发生强震的危险