基于机器学习和集成方法预测化合物的血脑屏障渗透性的研究方法

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:rtpy1015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
血脑屏障(blood-brain barrier,BBB)作为吸收的一部分,通过将大脑组织与血液分开来保护中枢神经系统。近年来,BBB渗透性已成为化学吸收、分布、代谢和排泄(ADME)预测中的关键问题。传统实验既昂贵又费时,并且成为了大分子文库高通量筛选的主要瓶颈。如今,已经开发出各种计算机模拟预测模型,这些模型可以帮助我们过滤和预测化合物所需的ADMET特性。集成学习所获得模型的预测性能要优于基本分类器的预测性能。因此,为了提高性能,我们建立了集成模型来预测化合物的BBB渗透性。在这项研究中,使用3种机器学习算法和9种分子指纹开发了计算机集成模型来预测BBB的渗透性,并且采用少数类过采样技术(synthetic minority oversampling technique,SMOTE)处理了数据不平衡问题。在五折交叉验证中,Ensemble Top-9模型获得了最佳的预测性能,平均准确率(ACC)为0.930,AUC(受试者工作特征曲线(ROC)下方的面积)为0.966,敏感性(SEN)为0.964,特异性(SPE)为0.839;在外部验证集中的AUC为0.849,ACC为0.784,SEN为0.812,SPE为0.712。该模型对于新分子可能具有很高的预测性能,可用于中枢神经系统药物的早期筛选。由于P-糖蛋白(P-glycoprotein,P-gp)在BBB中高水平表达,它阻止潜在的中枢神经系统药物进入中枢神经系统(Central Nervous System,CNS)。因此,我们用3种机器学习算法和9种分子指纹建立并检测了预测P-gp底物和抑制剂的集成模型,来判断药物是否为P-gp底物或抑制剂。其中对于P-gp底物的预测,最好模型是Ensemble Top-5,其在五折交叉验证中的AUC为0.840,ACC为0.759;在外部测试集验证中AUC为0.838,ACC为0.760。对于P-gp抑制剂的预测,最好模型是Ensemble Top-9,其在五折交叉验证中的AUC为0.918,ACC为0.849;在外部测试集验证中AUC为0.835,ACC为0.782。集成模型的AUC和ACC高于以同样训练集建立的基分类器模型,说明集成学习方法可以提高模型的预测性能。与近年来文献中报道的P-gp底物和抑制剂预测方法相比,我们最佳的集成模型获得了较高的AUC和ACC。综上所述,本研究的创新之处主要有两个方面:(1)采用了更加严格的条件对研究中使用的数据集去除重复(删除立体异构的重复);(2)同时构建了三种预测的分类模型(化合物血脑屏障渗透性模型、P-gp底物模型和P-gp抑制剂模型),更加仔细的探索了化合物的血脑屏障渗透性,所得到的模型性能较高且稳定。
其他文献
2020年5月28日,十三届全国人大三次会议高票表决通过了《中华人民共和国《民法典》(以下简称“《民法典》”),该部《民法典》在体系、制度及规则方面进行变动,新修、新增内容也较多。纵观整个《民法典》物权编的第四分编“担保物权分编”,其与《物权法》的担保物权编在条文数量、体系设置上基本保持一致,前者共72个条文,后者为71条,体系上也都分为一般规定、抵押权、质权、留置权四个部分,但若仔细研究,不难发
目的:通过对某地区"三甲"医院的医疗纠纷事件展开详细调查,了解该地区医疗纠纷发生的情况,并对医疗纠纷发生的原因进行探索性的归纳与分析。方法:采用访谈为主,问卷为辅的调查方法,对纠纷的起因、经过、结果、各方态度、改进思路进行调查。结果:对216例医疗纠纷案例进行分析,引起医疗纠纷的原因依次为经济因素(42.13%),疾病并发症因素(31.94%),技术责任因素(11.11%),患方因素(10.19%
蒙古族素以“马背民族”著称,作为游牧民族的生产方式和生活环境决定了他们与马的亲密关系。蒙古族爱马、惜马、饰马,对马具装饰特别讲究。蒙古族传统马鞍花(下文中“马鞍花”简称为“鞍花”)是马鞍具的重要组成部分,充分展现出实用与审美的双重功能。马鞍花工艺精湛、图案丰富、造型各异、种类繁多,体现出蒙古族的精湛手工艺和独特的审美观念,具有较高的研究价值。本文以蒙古族传统鞍花为研究对象,从蒙古族游牧文化、马鞍的
我国在过去几十年间大量建设的封闭住宅小区在一定程度上满足了城市居民不断增长的住房需求,却也带来空间结构封闭、公共交往缺失、邻里关系淡化,社会资源分配不均、街区活力不足等现状问题。2016年,中央城市工作会议发布文件推广街区制,提出原则上不再建设封闭住宅小区。2018年12月实施的新版《城市居住区规划设计标准》将“居住街坊”作为住宅建筑组合形式的居住基本单元,更加强调住区的开放性、与城市环境的融合性
随着信息技术的发展,家庭暴力逐渐走入公众视野,引起了人们的广泛关注。但由于暴力具有一定的隐蔽性,人们所了解到的暴力也只是冰山一角。本次翻译实践材料节选自《看你逼我做了什么》(See What You Made Me Do)第四章《羞耻感》。该书第四章节对澳大利亚家暴情况进行了翔实的报道,作者主要从生物学和心理学的角度探讨了暴力罪犯的内在动机,并为阻止家暴的发生提供了个人见解。如今,家庭暴力已经蔓延
为贯彻落实党中央、国务院关于持续推进减税降费的决策部署,进一步支持小微企业发展,根据《财政部税务总局关于进一步实施小微企业“六税两费”减免政策的公告》(2022年第10号),税务总局发布《国家税务总局关于进一步实施小微企业“六税两费”减免政策有关征管问题的公告》(以下简称《公告》)。现解读如下:一、《公告》出台的主要背景是什么?
期刊
伴随着短视频平台迅速崛起和“最严”广电政策监督之下,我国综艺节目的内容生产逐渐开始从垂直细分领域谋求突围,这成为未来国内节目创新的主导趋势。其中2018年《心动的信号》《我家那小子》《妻子的浪漫旅行》等综艺节目加入“第三视角”反观的真实,突破了之前单纯只为快节奏生活寻找出逃点的“慢综艺”的固定模式,用强大的市场反馈,迅速地占据了中国自制综艺的半壁江山,成为当下共议的热点,唤起观众的情感共鸣。与此同
预制语块是语言学习中的一个重要内容。国内外关于预制语块的研究主要集中在其定义、分类及功能上的探索。在口译研究中,学者们多数都着眼于同传领域,而对交传中预制语块的研究相对较少。因此,本文尝试把预制语块与交传结合起来,探讨其应用对学生译员汉英交传译语产出的多维度影响,这是本文的贡献之一。本文对预制语块的定义、分类、功能及国内外学者在口译领域的相关研究和文献进行了归纳、总结和分析,提出了如下研究问题:1
自工业革命以来,全球气温不断上升,最近几年,气温上升的速度明显加快,弱势群体如穷人正遭受不成比例的影响,他们的居住地,资产、健康、从事的行业均受到比他们的富裕同胞更大的影响,这会导致收入不平等的提高,进而使得一些人群重返贫困,整个国家的经济受到影响。本文基于全球116个国家1970至2015年的数据,使用固定效应面板数据模型对气候变化与收入不平等的关系进行了经验研究,结果发现,气温的升高会提高收入
诉的客观预备合并具有防止矛盾裁判、一次性解决纠纷等诸多功能,当前在大陆法系国家和地区均已通过判例明确认可其合法性。但是,在我国客观预备合并之诉没有得到应有的重视。因此,在客观预备合并之诉的建构初期,应当通过立法或者司法解释对于诉的客观合并制定统括性的规定,并以客观预备合并的相斥性、条件性为基础,初步理顺客观合并各形态之间的区分关系,最高人民法院可以发布指导性案例对预备合并之诉作初步规范以指导审判实