基于机器学习的真菌sRNA跨界调控机制共性化研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:shall202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
植物真菌病是一种侵染性病害,有侵染过程和传染性,种类繁多,占全部植物病害的80%左右,其中稻瘟菌、致病疫霉和灰霉菌给植物带来严重危害。稻瘟菌和致病疫霉导致粮食减产严重。灰霉菌宿主广泛,是限制温室大棚植物生产的首要因素。近年来研究发现致病真菌与植物存在sRNA(small RNA)跨界调控机制,在目前已有研究中,研究者均使用生物实验的方法对少数特定的真菌sRNA序列进行共性研究,而生物实验具有一定的限制,如序列条数过多,操作存在污染等。如今生物信息学迅猛发展,在数据分析、sRNA预测模型等领域均取得不错的进展,对于致病真菌跨界调控植物是否存在较多的相似性,目前尚未有研究者使用计算机的方法开展全面深入的研究。因此使用计算机的方法构建预测真菌sRNA是否为致病关键序列的模型,研究关键sRNA序列对植物的跨界调控作用以及共性化,对于控制真菌性病害、增产增收粮食和持久储藏蔬菜水果具有重要的意义。本文首先基于6种高通量非编码数据:稻瘟菌sRNA、稻瘟菌侵染水稻72h后混合的sRNA、灰霉菌sRNA、灰霉菌侵染番茄72h后混合的sRNA、致病疫霉菌sRNA、致病疫霉菌侵染马铃薯72h后混合的sRNA数据,对其进行大数据统计分析,将真菌侵染后相对于侵染前差异表达明显的sRNA作为致病关键sRNA。其次,挖掘和提取特征,应用KNN、朴素贝叶斯、决策树、随机森林、SVM、XGBoost六种机器学习算法对数据集构建真菌跨界调控植物的关键sRNA预测模型,对训练得到最优参数的模型进行比较,结果显示各模型均良好,其中XGBoost在三种真菌模型中AUC值最高且在准确率、召回率、精确度和F1 score指标中效果均较好,其AUC值分别为:稻瘟菌0.8642,灰霉菌0.9404,致病疫霉菌0.9445。随后对关键sRNA靶向预测结果的核心基因节点进行功能富集分析,得到多个GO(Gene Ontology)和KEGG Pathway。最后对三种真菌的功能富集结果进行共性化统计,得到水稻与番茄的Molecular Function(GO)交集为3个,水稻与马铃薯KEGG Pathway交集为16个;马铃薯与水稻KEGG Pathway交集为11个;马铃薯与番茄KEGG Pathway交集为15个;马铃薯、水稻、番茄中共有的KEGG Pathway为9个。本文所构建的真菌关键sRNA预测模型,是在多种机器学习模型中,对比了多个性能指标而得出的最优模型,该模型适应于本文的三种真菌,因此该模型在一定程度上可用于真菌侵染植物关键sRNA的预测,对真菌侵染植物的研究起到一定的促进作用。同时富集结果存在较多的交集,这表明真菌sRNA跨界调控植物时,对植物的功能和通路调控有着较多的共性,对KEGG Pathway的共性进一步分析,结果表明其可参与植物的基因表达调节和代谢等,从而影响植物的生长、发育、繁殖和对外界坏境作出反应。本文为真菌sRNA跨界调控植物的研究奠定了理论基础并拓宽了思路,为植物真菌性病害防治指出了新方向。
其他文献
带臂四旋翼无人机拥有快速机动的特点,具有在特殊环境下作业的能力,是无人机发展的一类方向。带臂无人机的性能受制于整机模型和控制系统复杂,近些年来吸引众多学者置身于此项研究。本文以带臂四旋翼无人机为研究对象,对其动力学模型的构建和稳定性控制系统展开研究。本文的主要研究内容如下:(1)机械臂动力学建模:建立一个3R关节机械臂,从建立空间坐标系入手,依次讨论了机械臂的空间坐标变换,运动学,动力学。主要应用
制造业是国民经济的主体,是立国之本、兴国之器、强国之基。随着《中国制造2025》计划的提出,国防、航天航空、生物医药、光学机械等军用和民用领域对自由曲面零件的需求越来越大。因此,自由曲面如何以高精度、高效率被制造出来一直是国内外研究机构研究的重点。抛光被认为是提高自由曲面表面质量最有效的方法之一。在抛光过程中,由于大部分CCOS抛光设备主要是通过改变驻留时间来实现磨抛去除,其不可避免的存在着效率较
现代汉语方位词是语义极其丰富的一类词,方位词的空间方位义是语言初始阶段人类赋予它的基本义,但随着人类认知活动的复杂化,语言表达需求随之提高,一些方位词便引申出了时间、数量、范围等语义范畴,比如:“上周”中的“上”表示“次序”,“世界上”的“上”表示“范围”,“后辈”中的“后”指代人,即“子孙后代”。其实,方位词的语义引申现象是认知思维下人类的选择结果,比如“上、下”除了表示方位外还可以表时间,其方
如今的互联网时代,信息数据量在以指数级别增长着,给我们带来很多便利的同时也带来了困扰。即在面对规模庞大的数据量时,想要高效的获得自己想要的数据变得愈发困难,这就是所谓的“信息过载”问题。推荐系统通过分析用户的历史行为,主动的从大量数据中为客户推荐用户可能感兴趣的信息,已经成为了缓解“信息过载”问题的有力手段之一。传统的推荐算法虽然有着不错的成绩,但依旧存在很多问题,比如冷启动、数据的稀疏性、不能利
天然气、石油等都属于重要的战略资源,因此对其进行开发和提取极其重要,而这些资源所处的环境一般为双重多孔介质。双重多孔介质是多孔介质和树状分叉网络嵌套组成的物质,在自然界中广泛存在,如油气藏、人体器官等,双重多孔介质的渗流特性一直是重要的研究方向,但存在着结构复杂难以完全模拟的问题。Herschel-Bulkley流体和工业生产生活中所用流体如石油、血液等有相似性,且分数阶在描述非牛顿流体时有其独特
人工骨植入人体来进行骨骼修复是目前临床医学的研究重点。在人工骨制备过程中,互联互通的孔隙与机械性能是两大关键特征。传统方法以及目前市场上主流的金属3D打印方法对金属材料的加工受到一定限制,无法加工特定形状的微小孔隙(小于200μm)。同时人工骨的机械性能与其内部孔隙关联度高,二者很难同时符合人体需求。为制备具有高精度微小孔隙结构的人工骨,制备结构、性能两者皆符合人体需求的人工骨,本文选用浆料直写3
在一些人类无法到达或可能危及生命安全的场合,如行星表面探测、泥石流、地震、井下塌方事故等,非结构地形、崎岖不平是这些场合的共同特点,轮式和履带式机器人在这些环境中的应用受到限制。六足机器人的结构特点相比于轮式、履带式机器人具有自由度多、越障能力强等优势。大型六足机器人的设计研发可促进国家机器人技术的发展,对于科技与国防具有非常重要的现实意义及研究价值,六足机器人的研究过程可以为实际工程应用带来极具
聊城地区历史悠久,形成了丰富的优秀传统地方特色文化。但是就目前而言,受到外来文化的冲击,再加上保护不到位,聊城优秀传统文化的传承存在一定的问题。聊城地区需要不断加大特色文化资源开发的力度,积极推进基层文化建设、文化惠民工程,推动文化产业化的发展,丰富文化创新空间,激发人民群众的参与性,实现传统优秀文化更好的传承与发展。因此,本文结合聊城优秀传统文化传承发展的重要作用,结合实际传承存在的问题,从跨文
视觉检测作为非接触式检测技术,是一项集机械、计算机、图像和自动控制等多学科于一体的综合交叉式技术,实现功能多,应用范围广。在工业生产领域,作为智能制造的重点,视觉检测技术在中国制造2025战略和庞大制造业市场需求的双重驱动下,迎来了前所未有的黄金发展期。视觉检测技术对于实现工件的智能检测具有巨大的实用和经济价值,所以有必要展开对视觉检测中相关技术的研究。图像滤波去噪和边缘检测是视觉检测的重要技术,
代谢组学是系统生物学的重要组成部分,主要针对一定时期内细胞中的代谢物进行分析。代谢物主要是指参与细胞反应的小分子,可以提供有关于细胞状态的详细信息,为后续的研究提供基础。质谱法是识别代谢物的标准方法,能够对化学样品进行详细的分析。样品在被电离后会产生离子混合物,质谱仪中的质量分析器能够根据质荷比对离子混合物进行分离并得到质谱。利用质谱可以构建出碎片树,用于解释实验样品的碎裂过程。碎片树由一组节点表