基于数据挖掘的若干化工过程优化和化合物构效关系研究

来源 :上海大学 | 被引量 : 18次 | 上传用户:bigboss555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是指综合运用多种算法,从大量数据中发现事先未知的信息和知识的计算机数据处理过程。作为一门多学科的交叉技术,数据挖掘已成为数据库系统和机器学习领域的重点研究课题,因其应用前景广阔而受到学术界和工业界的广泛关注。本文将数据挖掘技术应用于若干化工过程优化和化合物构效关系研究,主要的研究内容和研究成果如下:1.在系统研究了基于数据挖掘技术的氨合成装置生产优化方法的基础上,开发了具有自主知识产权的、用于解决合成氨工业生产操作参数优化的数据挖掘优化系统—DMOS合成氨优化系统,该系统由离线版和在线版优化软件组成。该优化系统具有一些显著特点,如融合了不同的数据挖掘方法、自动建模、模型更新、多模型优化策略、在线监测优化及友好的操作界面等,因而具有功能强大、操作便利和适应性强等明显优势。本工作还利用开发的DMOS合成氨优化系统,通过对云维集团有限公司沾化分公司氨合成装置1~#、2~#、3~#合成塔生产数据的数据挖掘,分别找出了影响装置入塔新鲜气量的主要工艺参数,建立了入塔新鲜气量与有关工艺参数间的数学模型,结果表明所建模型可靠性强,可为优化生产提供指导。2.从技术或经济角度看,化工过程优化是提高企业竞争力和经济效益的必要手段。本文将数据挖掘技术分别应用到某炼油厂偏三甲苯装置和某石油化工股份有限公司芳烃抽提装置生产优化,特别是首次将适合小样本数据建模的支持向量机(SVM)方法用于上述两个化工过程生产优化中,分别找到了影响装置优化目标的主要生产工艺参数,建立了装置优化目标与有关工艺参数间的定性、定量模型。结果表明:(a)较高的C01塔底温度(T01-01)、C02塔底温度(T02-01)(均控制在211±0.5℃)和较高的C01塔板温差(dT01)(30.5±0.5℃)有利于提高生产装置的偏三甲苯收率;偏三甲苯收率支持向量分类(SVC)模型的分类和预测正确率分别为100%和96.2%;偏三甲苯收率支持向量回归(SVR)模型的拟合与预报的均方根误差(RMSE)分别为0.028和0.034。(b)较高的T4504塔底温度(T04-01)(203.5±0.5℃)、较低的T4503灵敏温度(T03-02)(126±0.5℃)和较低的回流比(R)(0.27±0.2)有利于降低芳烃抽提装置抽余油中的芳烃含量;抽余油中芳烃含量的SVC模型的分类和预测正确率皆为100%;抽余油中芳烃含量的SVR模型拟合与预报的均方根误差(RMSE)分别为0.072和0.060。最后,在装置生产技术人员的参与下,制定了基于装置优化模型的生产优化方案,并成功应用于装置生产优化实践,为稳定生产和提高企业经济效益起到了十分重要的作用。据初步统计,两个优化项目实施后已产生直接经济效益近600万元。3.采用密度泛函理论(DFT)方法计算了139个多环芳烃化合物(PAHs)的8个量子化学结构参数,用遗传算法(GA)-SVR特征筛选方法分别得到了关联多环芳烃沸点(bp)、正辛醇/水分配系数(logKow)和色谱保留指数(RI)的最佳量化参数集,用基于训练集留一法交叉验证方法得到优化的SVR模型参数,多环芳烃bp、logKow和RI的SVR模型对训练集(样本数分别为45、52和90)和测试集(样本数分别为12、13和23)拟合和预测的R~2(分别为0.997、0.964和0.950)和q~2(分别为0.999、0.897和0.931)值较大。结果表明:SVR方法结合DFT方法计算的量化参数可以建立PAHs若干物性的较佳的QSPR模型,所建模型有很好的预测性能。4.开发了预测结构多样的芳烃的正辛醇/水分配系数(logKow)的QSPR模型。首先利用不同的化学软件计算了350个芳烃的68个分子结构参数,然后用最小冗余最大相关(mRMR)-GA-SVR特征筛选方法得到7个较佳的分子结构参数集,再用SVR 5重交叉验证方法得到优化的SVR模型参数,最后将SVR算法用于总结训练集300种芳烃logKow的QSPR模型,并将该模型用于测试集50种芳烃logKow的预测。本文还将SVR模型对芳烃logKow的拟合/预测结果与人工神经网络方法(ANN)、多元线性回归方法(MLR)和偏最小二乘法(PLS)模型的结果进行了比较。结果表明:SVR模型对芳烃logKow的拟合/预测的R~2和q~2分别为0.85和0.84,明显优于ANN(分别为0.82和0.80)、MLR(分别为0.77和0.77)和PLS(分别为0.77和0.77)模型的结果。5.总结了包含不同取代基团的581种芳烃对梨形四膜虫毒性的QSAR模型。用mRMR-GA-SVR特征筛选方法从计算得到的68个芳烃分子描述符中选出6个关联芳烃毒性最好的分子描述符,然后用SVR 5重交叉验证方法优化训练集芳烃毒性的SVR模型参数,进而用SVR方法得到训练集500种芳烃毒性的QSAR模型,最后将该模型用于测试集81种芳烃毒性的预测,并将SVR模型与PLS模型预测性能进行了比较。结果表明:SVR模型对芳烃毒性拟合/预测的R~2和q~2分别为0.77和0.67,其结果明显优于PLS模型(R~2和q~2分别为0.69和0.58)。
其他文献
时逢庆祝中华人民共和国成立70周年,人民政协成立70周年及《社会主义学院工作条例》深入贯彻落实之际,深入探讨新时代如何以贯彻落实《条例》为契机,把社院学报办成兼具有时
柴油机的燃烧过程主要在过量空气范围内进行,CO和HC排放量相对较少,主要有害排放物是NOX和微粒。要改善柴油机有害物质排放情况,除了采用燃烧系统改善等机内措施外,废气再循
传统入馆教育存在短时低效的缺陷,耶鲁医学院的个人图书馆员制度则贯穿新生的整个大学生涯,一对一的个性化服务有助于学生获得终身学习的技能,值得我国借鉴.对我国高校图书馆而言,个人图书馆员还是新生事物,这种主动的、连续的、全面的站在用户立场的服务,与以往图书馆员被动坐等读者上门完全不同,必须从传统的以图书馆资源为中心转变为以用户需求为中心的服务,馆员首先需要彻底转变传统服务观念与服务模式。此外,对个人图
今年是中国人民抗日战争胜利60周年.我党领导的八年抗战,可歌可泣,抗战精神永远是激励我们前进的精神动力;而这一时期形成的抗战教育,则是我党领导的职业技术教育的成功典范,
利用流态化技术,对以含水量低于1%的多钒酸铵(APV)为原料制取粉状V2O5工艺及工艺参数进行探讨,获得合格的粉状V2O5产品。结果表明:流态化制取粉状V2O5工艺可行,具有工艺流程短,
微博是网络社会环境中新出现的一种信息传播形式,它具有即时性、便捷性、交互性强等优势.微博给信息传播和新闻报道注入了新的活力.然而,微博中也存在信息失真等问题,需要完
梦是在睡眠过程中产生的一种生理、心理现象。很久以前人们就对梦发生了兴趣,并试图解释它,然而至今仍然是公认的宇宙奥秘之一。国外有关研究表明:人的一生大约有三分之一的
本文论述了图书馆实行定额管理的利弊及目前存在的问題。文章认为,只要合理、科学,定额管理在图书馆工作中是可以施行的。
为纪念《轻金属》杂志创刊50周年,《轻金属》编辑部从创刊以来所出版的《轻金属》中,筛选出一批反映轻金属工业发展过程的优秀论文,编辑出版了“《轻金属》创刊50周年优秀论
研究背景不孕的研究是生命科学的一部分,是人类共同关注的常见疑难病症,目前已成为全世界面临的医学问题和社会问题,本病不是一个独立的疾病,但其病因相当复杂,既有器质性病