面向配体虚拟筛选的多任务深度迁移学习算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:yahu911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
G蛋白偶联受体(GPCR)是最重要的药物靶标之一,约占市场上药物靶标的34%。药物研究发现,配体生物活性的准确建模和解释对于筛选和优化配体生物活性至关重要。传统机器学习方法效果不佳,需要新的方法,通过精确评估配体生物活性并寻找能够决定配体生物活性的关键亚结构特征,来解决这个问题。先前的大量研究表明,同源的G蛋白偶联受体促进了配体分子生物活性的建模和解释。因此,本文提出了一种新的方法GLEM,用来预测配体的生物活性并通过组稀疏来识别与GPCR相关的关键子结构,从而利用多源深度迁移学习来做配体生物活性的预测。GLEM主要包含五个连续步骤:(i)表征配体分子的ECFP,(ii)采用组稀疏学习进行目标域及源域中配体分子的特征选择,得到决定配体生物活性的关键子结构;(iii)训练源域数据的深度多任务学习模型;(IV)得到基于深度多任务迁移学习的目标域配体分子的生物活性学习模型;以及(V)得到基于深度多任务迁移学习的目标域配体分子的生物活性预测模型。GLEM方法在涵盖了人类GPCR大部分亚家族的9组共30个代表性GPCR上进行了检验,每个亚家族都有60-3000个配体缔合。GLEM方法相比于单任务学习方法的相关系数(~2)平均提升了31.72%;相比于深度多任务学习方法的相关系数(~2)平均提升了22.45%;相比于组稀疏深度多任务学习方法的相关系数(~2)平均提升了7.8%;相比于单源迁移学习方法的相关系数(~2)平均提升了3.6%。结果表明,GLEM方法与本文选取的多种对照方法比较,在绝大多数数据集中都是表现最好的,在建模配体生物活性方面取得了出色的性能表现。此外还进行了不同数量的训练样本情况下的对比,通过分析发现本文GLEM方法在小样本情况下性能表现最好。
其他文献
近些年来,人工智能产业进入了高速发展的阶段,各国对相关领域的投入日渐增多,世界各所知名大学对这些领域也尤为重视。情感计算是这些领域中十分重要的一个课题。人脸识别等课题经过了长期的研究和发展,其常规条件下的识别精度已经达到了较高的水平并大量应用于日常生活中。人们不再仅仅满足于单方面使用机器来使自身的生活更加便利与舒适,更多的人希望能够实现科幻电影中那样与机器人无障碍地交流,当前技术还不能满足这样的要
在我国科技水平持续提高的背景下,智能化技术实现了较好的发展,机械生产制造也对智能化技术提出了更高的要求。当前,开展机械制造工作时利用传统机电技术难以满足技术创新要求,巧妙地将机电一体化技术引入智能制造中,促使机电技术能够同机械制造进行巧妙地融合,进一步强化智能制造技术发展的基础。基于此,本文主要探究了机电一体化与智能制造的概念,然后对机电一体化技术的运用进行了分析,最后总结归纳了此技术的发展
期刊
基片集成波导(SIW)因其低损耗、高Q值、低成本以及易集成的突出优势而被广泛关注。但SIW结构本身存在两排金属化通孔,使其加工工艺变得复杂。而类梳状线基片集成波导(CSIW)作为一种新型技术解决了SIW的痛点。它使用四分之一波长的梳状线代替金属通孔,既简化了加工工艺,又便于与有源电路集成。本文以CSIW为基础,开展对CSIW功分器和滤波器的研究。本文首先基于HMCSIW(半模类梳状线基片集成波导)
随着互联网的发展,人们越来越习惯于在网上发表观点、表达情绪,收集、分析并整理这些带有情感倾向性的文本信息,可以更好地了解人们的行为和习惯,具有一定的社会和商业价值。传统的情感分析主要针对文档或句子进行研究,而方面级情感分析可以针对文本中的某个方面进行细粒度分析,近年来成为情感分析领域的研究热点。应用深度学习方法,充分挖掘文本内语义特征,建立单词之间的联系,是方面级情感分析研究中的主要方法。针对方面
随着社会经济文化的发展,人们在精神需求方面有了更高的要求,对于文创产品有了一定的需求。画像石是我国古代艺术家用刀雕刻在石头上的艺术品,图案精美,雕刻技法高超。吕梁是我国画像石的分布地之一,吕梁画像石博物馆中陈列了许多汉代的画像石,对于研究汉代的历史具有十分重要的意义。本文通过对吕梁画像石博物馆在文创品方面的现状进行分析探讨,查阅相关文献资料将画像石内容分为了神话传说、现实生活、历史故事和装饰图案类
命名实体识别是一项从文本中将具有特定意义的实体提取出来的技术,是自然语言处理领域的重要基础研究任务。在中文新闻语料中,由于文本实体中存在一词多义现象,以及长句中不同层次的特征未能得到充分整合的问题,使得现有命名实体识别模型的性能降低。人工智能的发展,使利用深度学习算法提高命名实体识别模型性能成为目前研究工作的热点。论文针对现有模型无法解决一词多义现象和不能有效捕捉多层特征的问题,提出基于注意力的多
绘画的方向应当归于自己的内心,画面的呈现是艺术创作者内心精神世界,也是个人生活于世的人生经历的总结。笔者以不同环境下的写生体验为基础,认识到图伊曼斯画面所营造的苍白冷淡压抑的气氛能够引发观者的情绪共鸣,多伊格画面中剪影化的人物与不规则的平面图形组成了独特的绘画语言符号,使其拥有着忧郁、冷静的气质。笔者在绘画语言的多样性探索中采用了平面图式的表现方式,将所见图像与心中情感相结合后重新解构,寻求将内心
通过研究亚历克斯·卡茨所处的时代背景、生活环境、学习历程和他接受过的采访等各方面的资料,通过收集和梳理,来探寻其绘画是如何把大脑思维想到的和眼睛看到的事物进行概括、简化到画布上变成和谐的色彩、平面的图案。通过内容上的安排,构图处理和平面化的处理以及鲜艳色彩对比地运用使他的作品从内容到风格,都丰富多彩。亚历克斯·卡茨的作品中融合了抽象主义与现实主义,具象的人物、现实主义的元素,而人物的肤色等又有别于
近年来,基于深度学习的高光谱影像分类已经成为遥感领域研究的热点之一,以卷积神经网络为代表的分类模型在高光谱影像分类方面达到了高精度与高效率。然而,高光谱遥感影像分类过程中存在特征代表性不强、特征层次单一以及分类决策单一等问题,可能导致分类结果不稳定。鉴于此,本文采用Indian Pines和University of Pavia两个高光谱数据集,开展基于深度学习的高光谱遥感影像分类研究,具体包括:
生活是艺术创作的土壤,丰富的情感是种子,生命体验是源泉。没有情感和思考的创作者,形同机器,没有创造力的作品,毫无生气。关于绘画创作和情感表达的关系讨论由来已久,在科技发达的今天,人类的情感发挥着唤醒人性、激发创作的重要作用。本文旨在以我的孤独情感体验为创作的出发点,直面孤独,包容生命的不完美,成全它的生长,这样的孤独才具有尊重、爱护其他生命的力量。本文首先分析中西绘画作品中表达孤独的方式,从中解析