基于融合决策模型的启动子甲基化位点预测研究

来源 :景德镇陶瓷大学 | 被引量 : 0次 | 上传用户:freegfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类癌症基因组的低甲基化和特定肿瘤抑制基因启动子的高甲基化是癌细胞快速增殖的重要原因。因此,获得5-甲基胞嘧啶(5mC)在启动子片段中的分布是进一步了解启动子甲基化与mRNA基因表达调控之间关系的关键步骤。通过湿法实验大规模检测DNA中5mC位点仍然很费时且费力。因此,迫切需要设计一种鉴定全基因组DNA启动子5mC位点的方法。本文主要基于一种新型的融合决策模型研究启动子甲基化位点的预测问题,主要研究内容如下:1)构建了一个名为i Promoter-5mC的融合决策预测器。根据名为癌细胞系百科全书(CCLE)的数据库,使用经过简化亚硫酸氢盐测序技术产生的843个细胞系中得到的17182个基因的启动子区域信息,构建了关于肺小细胞癌(SCLC)的启动子甲基化数据。由于正样本和负样本比例高达1:11,属于非平衡数据,为此我们构建了11个预测器,将非平衡数据转化为平衡数据。采用独热编码(Onehot)和基于核苷酸的性质和频率(DPF)方法对启动子样本进行编码。预测器使用深度神经网络(DNN)识别启动子中的甲基化修饰位点。采用融合决策方法对11个预测器预测结果进行融合。该预测器在独立测试数据集上的平均AUC为0.957,表明启动子5mC甲基化位点的预测器是可靠的。为了方便广大生物学家和基因药物学家可以方便使用iPromoter-5mc预测器,我们设计了在线免费预测网站:http://www.jci-bioinfo.cn/i Promoter-5mC,研究者不必理解复杂的算术公式和编写程序,只需将所测序列通过网址提交,就可以得到需要的结果,为用户研究启动子5mC修饰位点提供简单有效的方法。所设计方法的源代码也可从https://github.com/zlwuxi/iPromoter-5mC上获取用于相关学术研究。2)基于卷积神经网络构建了启动子识别预测器。如果能首先预测所输入序列是否为启动子序列,这可以有效提高对启动子甲基化位点的预测。根据前者得到的启动子区域信息,构建了启动子和非启动子的数据。对比梯度提升迭代决策树(GBDT)模型、深度神经网络、XGBoost和卷积神经网络建模方法,构建对启动子和非启动子进行识别的预测模型,在独立测试集上对该模型进行了测试,平均AUC为0.9166,这表明关于启动子识别的预测器是可靠的。
其他文献
纵观艺术设计史的发展历程,不同时期都有着相应的艺术风格,呈现出一定的差异性。陶瓷作为一种历史久远但又从未停止创新的艺术门类,几乎伴随着我国整个文明发展史。在中国传统文化范畴,世间万物不外乎两种极端——即“简”和“繁”,在艺术设计中不论是“繁复”还是“简约”都体现了当时的社会发展状态和人们的思维方式。尽管作为外来词汇的“极繁主义”和“极简主义”,提出的时间较晚,但是却在历史上的各个时期都有所体现。陶
马克思认为“社会生活在本质上是实践的”[1],那么包含于社会生活中的艺术活动、文化活动、生产活动,哪一个又不是通过人的社会活动而实践出来的呢?因此,我们在讨论文化与艺术问题的时候,是无法脱离历史实践,脱离人的社会性去观察认识问题的。且正如马克思主义所宣白的,实践是具有社会历史性的,单独一个瓷工、艺术家,亦或是任何孤立的个人或集体,他们所生产创作的陶瓷产品或艺术作品,都不是独立的实践与活动,它们来源
随着中国的快速发展,我国工业对能源的需求越来越多,对环境污染越来越严重。如何提高能源的利用率、减少污染物的排放成为当前我国工业发展的首要问题。陶瓷生产的能源消耗和污染物排放主要来自于隧道窑烧成设备,优化隧道窑结构,可以缩短烧成时间,减少能源使用和污染物排放。本课题通过数值分析方法研究隧道窑预热带窑顶逆吹气流对温度场和速度场的影响,并且改变逆吹气流的角度、温度、流速,找出不同逆吹气流的角度、温度、流
精酿啤酒是近年来进入我国消费市场的新兴啤酒产品,在美国和一些欧洲国家中已经具备了相对成熟的市场。根据市场调查及相关研究显示,我国工业啤酒市场的增长正在减缓,而相比之下精酿啤酒市场正处于一个稳定的发展期。可以预见,未来精酿啤酒将越来越多的出现于消费者的视野中,并为广大消费者所接受。本文将聚焦并探讨在精酿啤酒包装设计系统中最具有形式特点的标签设计,并以酒类产品中不可或缺的产地因素为出发点,探寻地域文化
本文系统归纳了青花瓷的起源、出土情况、特征、工艺水平及产地,在此基础上,通过能量色散X荧光光谱分析(EDXRF)、分光光度计、X射线衍射分析(XRD)等测试手段系统研究了青花色料的成分和呈色之间的关系,探讨了古青花瓷及仿古青花瓷中青花色料组成对其呈色的影响。得出结论如下:唐青花起源于巩义窑,较粗糙原始,属于釉下蓝彩。宋青花胎质逐渐细腻,受益于贸易,元青花开始享誉海内外,其色料来源有进口钴土矿、国产
本文利用来源广泛且价格低廉的苏州土、烧滑石、工业氧化铝为原料固相合成堇青石粉体,探讨Mg2Al4+xSi5+yO18体系中Al2O3、Si O2的正向偏移以及烧成制度对堇青石合成率的影响并对实验结果进行了直观分析和优化,得到了高纯度堇青石的最佳合成配方,在此基础上选择Fe2O3、Li2CO3、Zn O、Ti O2四种金属化合物来探讨金属离子掺杂对堇青石粉体红外性能的影响,并优化出合成优良红外性能粉
课题结合国家自然科学基金项目“基于CFD-DEM耦合方法的Si3N4粉体干法制备机理研究(项目编号:51964022)”,由于氮化硅空心微球压缩度小、微球粒度不均、球形度不足等问题,制约氮化硅陶瓷轴承的性能参数及应用发展。基于旋转蒸发工艺,构建氮化硅空心微球成型的接触函数方程、运动函数方程、流变函数方程,数值模拟旋转蒸发工艺制备氮化硅空心微球过程。采用正交实验分析工艺参数与氮化硅空心微球性能的关系
针对岩板料浆制备存在能耗高、污染大、效率低等缺陷,采用新型多层叠合球磨制备工艺改善当前行业现状。基于离散元法、有限体积法耦合分析多层叠合球磨的破碎、粉磨过程内部流场特性,优化多层叠合球磨制备工艺参数,改善多层叠合球磨制备岩板料浆性能。依据岩板多层叠合球磨机工作原理,构建岩板多层叠合球磨机内部流场湍动能数学模型,并对研磨体运动方程、介质水运动方程进行推演,建立岩料破碎-粉磨过程运动流变方程。构建岩板
随着微波通信技术的不断发展,人们对微波元器件的市场需求越来越大,为了进一步研发器型小、质量高、制造成本低的微波元器件,研究低介电常数、高品质因素的微波介质陶瓷具有重要意义。Mg2TiO4微波介质陶瓷具有较低的介电常数和较高的品质因数(er=14,Q×f=150000 GHz),原料来源丰富且生产成本较低,属于典型的高品质因素微波介质陶瓷,逐渐引起了研究学者的广泛关注。但是由于Mg2TiO4陶瓷介电
陶瓷喷墨打印技术因其装饰效果细腻真实、打印清晰度高、打印速度快,可定制图案且无需制版等优点成为当前陶瓷装饰技术的主流。然而,喷墨打印所使用的陶瓷墨水是悬浮体系,容易出现絮凝、沉降而导致堵塞喷头的问题。为此,需要将悬浮体系的墨水发展为固态陶瓷色料,这是新一代陶瓷装饰技术——陶瓷激光打印技术的核心。陶瓷激光打印技术对陶瓷墨粉在粒径分布、颗粒形貌、流动性和荷电性等方面具有严格的要求。为解决上述问题,本论