【摘 要】
:
近年来,肠道微生物成为医学和生命科学的研究热点,研究表明人类的健康状况甚至是大脑情绪与肠道微生物息息相关。肠道微生物种类的存在与否,以及各类微生物的相对数量对疾病
论文部分内容阅读
近年来,肠道微生物成为医学和生命科学的研究热点,研究表明人类的健康状况甚至是大脑情绪与肠道微生物息息相关。肠道微生物种类的存在与否,以及各类微生物的相对数量对疾病的诊断与治疗都有很大的指导意义。所以引入机器学习方法来分析各类疾病与肠道微生物的关系是十分重要的研究。研究疾病的肠道微生物组数据存在一个特点:类数据含有的标签较少,或者是标签较难获取。这使得传统的机器学习方法在很多情况下效果不佳。基于这个问题,本文运用了主动学习算法来分析疾病与肠道微生物的关系。基于多种疾病的微生物组数据,包括物种丰度数据以及基因丰度两类数据,运用主动学习的多种算法对样本进行分类预测,同时对其进行样例选择。结果表明,主动学习在效率与精确性上优于已有方法。具体贡献如下:第一、提出了一种基于主动学习算法的疾病预测方法:针对疾病与肠道微生物标签少的特性,主动学习可以将信息含量较大的样本主动地选出交给训练器迭代训练,大量研究表明该算法在标签少的数据集中表现较好。本文主要运用三大类主动学习算法对肠道微生物数据进行疾病的分类预测。实验结果表明,主动学习在运用于这类微生物数据上效率与精确性对比与其他的传统算法有明显优势。第二、提出了一种基于学习算法的肠道微生物与疾病样例选择方法:在许多疾病患者中,如何选出对于疾病研究价值高的样例对分析疾病有着重要意义。对于传统的一些样例选择算法,有些算法效果不明显。本文运用基于池的主动学习的样例选择策略,主要包括基于批处理的判别性和代表性查询的主动学习算法和基于自定进度的主动学习算法,对肠道微生物数据进行样例选择。比较结果表明,主动学习在运用于此类数据上对比于其他算法精确性能提高很多。综上,在微生物组数据分析上,主动学习算法对比于其他的机器学习算法有许多优势。主动学习不需要所有样本有标签,需要标签样本较少,算法能重复迭代训练学习器,从而获得较为准确的结果,是一种微生物组数据分析的有效方法。
其他文献
设置专门用途英语课程是培养用英语获取信息和进行交流的复合型人才的重要途径。但目前教材建设中存在一些问题:教材的选用随意,编写缺乏理论依据;难度不符合学习者的实际情况
前陆盆地异常高压形成机制较为复杂,除一般型沉积盆地常发育的沉积型超压和可能的传递型超压外,还发育有构造挤压型超压。本文综合考虑沉积型超压、传递型超压和构造挤压型超压,对准噶尔盆地南缘下组合地层进行了定量评价和演化特征的总结,研究成果对前陆盆地油气勘探有间接指导作用。本文首先以现今实测压力数据以及编制的泥岩压实曲线为基础,对研究区异常地层压力的分布特征进行了分析研究。通过对编制的泥岩压实曲线、构造演
工业固体废物的大量排放,一方面对生态环境造成严重的破坏,危害人类身体健康,另一方面,在社会经济高速发展和自然资源匮乏的矛盾下,工业固体废物的乱排是对资源的浪费。近年来随着采矿规模不断扩大和加速,工业固体废物的堆存量也迅速增多,国家以及广东省政府相继出台了一系列的政策规划加大对工业固体废物的管控力度。为响应国家政策的号召,发展循环经济,实现社会经济和生态文明的共同发展,大宗工业固体废物的资源综合利用
目的:探讨以综合活力取代常用的主观幸福感作为积极指标构建中学生心理健康双因子模型的可行性和有效性,对模型数据进行追踪以评价模型的应用情况。方法:采用社会与情绪健康
股票市场作为国民经济的“晴雨表”,是业内各界公认的实体经济的信号系统,同时股票市场也是连接企业和投资者的一个枢纽。因此对股票市场波动风险进行研究,更好地去预测市场波动,可为企业提供更好的保值、增值策略,为投资者防范风险提供有力参考。波动率作为风险测度的代表性变量,衡量了标的资产价格(收益率)变化程度,是机构和投资者进行金融产品定价、风险对冲与管理时关注的核心因素。但是,波动率自身是无法从市场数据中
垂盆草是通过保护肝细胞来降ALT,还是仅仅是ALT 活性抑制剂?以鸭乙型肝炎自然感染模型作为实验对象,采用垂盆草有效片段提取物,观察了垂盆草对鸭肝脏病理的影响、对肝细胞脂
从俳句以及俳句汉译的发展与韵文性入手,研究俳句的汉译形式以及汉译标准,并以美学、翻译学以及比较文学的理论作为论证依据,从主体性的角度将俳句汉译研究加以完善。
为了探究播期和播量对山西省晋中盆地冬小麦籽粒产量及构成要素的影响,为生产实际提供理论依据。以晋太182为试验材料,采用二因素(播期、播量)随机区组试验,研究了播期和播量
[目的]对手足口病患者标本进行病毒核酸检测,探讨实时荧光定量RT-PCR方法在手足口病疫情监测中的意义。[方法]采用实时荧光定量RT-PCR方法对2010年3~8月连云港市采集的307份手