有机化合物对水生生物毒性的预测方法研究

来源 :辽宁大学 | 被引量 : 1次 | 上传用户:lw4564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着重工业以及水产养殖业的不断发展,大量的有机污染物进入到水环境中,对人类的健康以及水生系统造成了严重的危害。目前,机器学习方法可以有效地处理数据以及建立优质的模型。集成学习基于多个基分类器建立而成,它通常比任何单个模型的性能具有更好的预测能力。因此,本研究基于文献搜集筛选的实验数据,利用机器学习以及集成学习方法,对有机化合物的生物富集因子以及水生生物的急性毒性两个指标进行预测,进而分析有机化合物对水生生物的毒性机理。在评估有机污染物对水生生态系统造成的风险方面,生物富集因子和半数致死浓度(LC50s)是十分关键的参数。目前,已经开发了多种定量结构-活性关系(quantitative structure-activity relationships,QSAR)模型来预测生物富集因子以及对水生生物的急性毒性进行分类。在建立生物富集因子预测模型中,本文使用递归特征消除方法分别结合支持向量机和多元线性回归算法开发了回归模型。在回归模型中,本文从包含500种不同化合物的数据集中计算出2D分子描述符。在急性毒性的分类预测中,本文使用三种机器学习算法构建了三个集合模型,并且在分类模型中从包含400种不同化学物质的数据集中计算12种分子指纹。在回归模型中,RFE-SVM模型呈现了更好的预测能力,R2??分别为0.860和0.757,通过其他指标也可以表明本研究的回归模型可以做出良好的预测,并且符合Golbraikh,Tropsha和Roy设定的标准,对新型化合物进行有效地预测。在分类模型中,ensemble-SVM分类模型在五折交叉验证中的总体准确率、敏感性、特异性以及AUC(受试者工作特征曲线下面积)分别为92.2%、95.1%、86.0%和0.965,在外部验证中分别是87.3%、92.6%、76.0%和0.940。本研究的ensemble-SVM模型比以前报道的模型更加稳定,并且能够给出更加准确的预测。因此,该模型能够有效地预测水生生物的急性毒性以及为对水生生态系统的风险评价做出贡献。此外,通过分析两种模型,本研究鉴定了一些与生物富集因子和急性毒性相关联的化学结构,特别是结构aaCH,芳香结构,氢键基团和水分配系数,在今后的水生毒理学实验和水生生态系统的风险评估中应当被更加关注。综上所述,本文具有以下创新性的工作:(1)建立了针对水生急性毒性的集成分类模型,获得了更优的性能参数;(2)将生物富集因子与急性毒性两类关键参数结合分析有机化合物对水生系统的风险评价。
其他文献
目的:探讨ZNF403和p21在非小细胞肺癌组织中的表达及分析其与生存预后的相关性。方法:研究从2013年6月至2016年2月间中南大学湘雅医学院附属肿瘤医院临床资料及病理资料完整的肺癌患者1539例中筛选出符合实验的患者共125例,选取晚期及不可手术的局部晚期NSCLC病例53例,可手术的早期患者72例,从病理科获取其组织标本蜡块。采用免疫组织化学法,在53例晚期及不可手术的局部晚期NSCLC组
医学Meta分析中涉及稀疏数据的现象十分常见,如纳入Meta分析的研究数量较少(2~4个)、感兴趣的测量结局为二分类数据且十分稀疏等,这些特殊情况在数据分析方法上面临着众多挑
本论文采用近红外光谱并结合化学计量学对剩余污泥中蛋白质进行定性和定量分析,并利用湿化学分析法和光谱分析法对剩余污泥厌氧发酵过程进行表征,分析了剩余污泥中细胞物质的
目的 了解重度子痫前期并发症的发生情况及结局.方法 本研究回顾性分析2011年7月至2013年7月在我院收治的162例重度子痫患者的治疗及产妇转归情况.结论 重度子痫前期有严重的