基于层次贝叶斯模型的微生物关联网络推断方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:hellojie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
了解微生物之间以及微生物与环境之间如何交互是微生物生态学重要的研究课题。但是由于传统的基于实验室培养的研究方法的限制,生物学家对真实环境中微生物群落内部的交互了解甚少。宏基因组测序技术的发展使得研究者可以通过分析微生物的基因序列来了解真实环境中微生物的组成和丰度,然后利用关联推断算法来帮助分析微生物群落中复杂的交互作用。然而测序数据产生过程和微生物交互的复杂性为关联推断算法的设计带来了一系列挑战。现有的关联推断算法多是针对一到两个问题如组成成分偏差、间接关联或非线性关联等进行设计,没有综合考虑影响微生物关联推断的各个因素。本文针对现有关联推断算法存在的问题,提出了两种基于层次贝叶斯模型的微生物关联推断方法,能够较为全面地考虑到测序数据产生的特点和微生物交互的规律。本文的主要创新点如下:1、考虑静态关联网络推断算法存在的组成成分偏差、过度散布、间接关联、和环境因素影响的问题,本研究首先提出了对数正态-狄利克雷-多项式层次贝叶斯模型。该模型能够同时估计具有条件依赖性的微生物之间的关联和环境因素与微生物的关联,并且考虑组成成分偏差和过度散布的问题;估计的微生物关联能够去掉间接关联,增加了关联推断结果的可解释性。该模型关联推断的有效性在仿真数据集和多个真实数据集上得到了验证。2、考虑在复杂关联推断中的非线性关联问题,本研究基于静态关联推断的层次贝叶斯模型,通过对环境因素的分布做假设,提出了考虑环境变化的多关联网络推断算法。该算法能够估计数据集中可能的环境条件,并且在每种环境条件下推断条件依赖的微生物之间关联和直接的微生物与环境因素之间的关联。每种环境条件是综合考虑环境因素、微生物种类和丰度相似性的结果,便于生物学家分析微生物组成和关联的异质性。在真实数据集上的结果证明该模型能够有效分析大数据集中的复杂关联。3、综合上述两种关联推断模型,本研究提出的层次贝叶斯模型关联推断框架能够同时适用于环境因素较少、样本数有限时的静态微生物关联推断,和大样本量、环境因素较多、微生物群落较复杂时的多关联网络推断。该框架具有优秀的可扩展性。
其他文献
近年来,单原子催化剂在非均相催化领域引起了广泛关注。单原子催化剂不仅原子利用率高,而且在催化CO氧化、水煤气转换、醇的选择性氧化、二烯烃或炔烃的选择性加氢等诸多化学反应中表现出优异的活性及选择性。然而,目前单原子催化剂也面临着诸多挑战,比如单原子在反应过程中的团聚、单原子负载量较低、单原子和纳米团簇孰优孰劣、单原子在特定反应条件下的局部结构等问题。本论文运用密度泛函理论方法,系统地研究了单原子催化
超薄平面结构赋予二维原子晶体诸多优异与新颖的物理、化学性质,在电子器件、催化等领域呈现出广阔的应用前景。这类超薄晶体材料在厚度方向上仅有少数原子,其性质呈现出高度的结构依赖性,因而这类材料的结构表征对其性能调控与实用化至关重要。然而,超薄的特性使得这类材料在表征过程中易发生结构损伤。目前常用于表征二维材料物理结构的显微、光谱及光学等手段具有各自的局限性,尚缺乏可无损表征这类材料的普适性方法。除物理
绝大多数金属结构材料中含复相组织,其力学性能受各相的数量、形貌、分布、取向、大小等的影响。随着表征技术的进步,研究组织中细小沉淀相的晶体学形貌才成为可能,然而对大多数材料而言,目前相关知识都不完善。本工作系统地研究了高锰钢中先共析魏氏渗碳体的形貌、相变晶体学、界面迁移模式、表面浮凸效应,力图通过对该系统的研究,提高对化合物沉淀相形貌和相变晶体学的深入认识。利用透射电子显微镜和扫描电子显微镜表征了渗
刺激响应性高分子是指在外界环境发生较小的改变时,在结构和性质上产生较大改变的材料,能够将化学或者生化信号转化成光、热、电或机械力信号,反之亦然。为了能够对生命体的奥秘实现更深入的研究,发展新型的智能生物材料和纳米技术、研究新型刺激响应性高分子材料具有重要的意义。其中,具有活性氧响应性的高分子材料尤为重要。活性氧物种,作为广泛存在于生物体内的一类活泼物种,与很多疾病的产生都息息相关。近年来,关于活性
聚合诱导自组装(PISA)是近年来高分子合成与自组装领域的重要前沿技术,它是在聚合反应制备两亲性嵌段共聚物的同时发生原位自组装。这种技术可以实现组装体高浓度、形貌可控的简单制备。然而,PISA的原理要求单体可溶而聚合物不溶。这极大地限制了PISA方法单体/溶剂体系的选择。为了拓展PISA单体/溶剂的选择范围,特别是水相体系的单体选择,本论文发展了基于主客体相互作用的聚合诱导自组装方法。通过形成主客
印度河流域是世界范围内第十二大流域,其中有47%的流域面积落在巴基斯坦境内。受干旱-半干旱气候类型的影响,巴基斯坦境内的农业灌溉和居民用水均极度依赖于印度河水系的供给。然而,由于当地水文气象观测数据获取有限,多数学者围绕印度河上游流域开展水文研究。为了探究印度河流域水文和气候的变化趋势及其关键驱动力,论文广泛收集地面监测资料,并与卫星/同化降水数据相结合,利用多种水文模型,对研究区内的径流变化及其
海岸线是陆地和海洋相互交汇的界线,受海平面变化、潮汐、波浪和风暴潮等影响而表现出强烈的动态特征。海岸线变化信息是监测海岸带地区多要素影响下生态环境变化的重要指示标志。过去的几十年,区域至全球尺度的海平面上升及其加速已经被广泛观测到。很多区域尺度的研究观测到海岸线在向陆地后退。海平面上升也可能增加海岸带地区的脆弱性。海岸线变化监测有助于进一步揭示海岸线变化的驱动力,有助于进行科学合理的海岸带管理和可
粘滑现象在自然界中广泛存在,地震研究领域将其作为地震发震机理的模拟。相关研究表明,发震断层内部的断层泥对断层摩擦性质起到了关键的控制作用,因此采用颗粒模拟断层研究粘滑事件过程中各种关键参数的变化,可以帮助我们深入了解地震的发震机理。本文采用实验室双直剪实验方法,重点研究颗粒模拟断层粘滑现象受法向应力、断层厚度、环境湿度、颗粒材料性质等物理量的影响,进而提出对颗粒模拟断层粘滑过程中微观机制认识的改进
海底滑坡是海洋环境中的滑坡并起着输移海底泥沙的作用。它会对海底光缆、海底管线、海上平台等基础设施造成极大破坏,甚至能诱发海啸,引起一系列次生灾害。海洋资源开发及频繁发生的极端天气增加了海底滑坡的风险,对生命及财产安全构成严重威胁。海底滑坡的成灾机理、运动规律与数值模拟是海洋岩土工程领域的热点和难点研究课题。本文结合物理试验、理论分析、数值计算等方法,对海底滑坡开展系统研究:基于离心模型试验,研究高
水文集合预报可以给出预报量的统计分布,定量描述预报信息的不确定性。随着气象集合预报技术的发展,基于气象预报信息的水文集合预报,已经成为水文预报研究与应用的发展方向。根据气象预报地面验证的评估结果,欧洲中期天气预报中心(ECMWF)的气象集合预报产品在中国区域具有较好的预报性能,但其在水文预报中的性能尚缺乏系统研究。论文基于ECMWF System 4气象集合预报产品构建了中长期径流预报系统,评估了