基于深度迁移学习的单细胞转录组测序数据聚类算法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:sly4352
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单细胞转录组测序技术以单个细胞为分辨率测量基因表达值,为解析组织内部异质性提供了机遇。组织内部异质性的研究能够发现新的细胞类型,研究细胞复杂的分化和发育轨迹,并提高对人类肿瘤等疾病的理解。为了更加准确地解析组织内部的异质性,我们需要识别组织内部包含的细胞类型。面对单次实验产生的数千甚至数百万个细胞的测序数据,目前最主流的方法是通过对给定的单细胞转录组测序数据进行聚类来识别细胞类型。虽然已有很多学者提出了关于单细胞测序数据的聚类算法,但是一方面,面对大样本、高维、高稀疏性和无监督的单细胞转录组测序数据的聚类问题,传统的机器学习算法无法准确刻画从基因表达到细胞类型之间复杂的非线性映射关系;另一方面,现有算法主要是针对给定的单细胞测序数据去识别细胞类型,它们没有利用目前已经公开发表且已有可靠细胞类型注释的参考图谱来帮助目标数据集聚类。于是基于深度学习和迁移学习方法,我们提出了一种基于深度迁移学习的单细胞聚类算法。该算法一方面通过深度编码模型去挖掘细胞类型和基因表达之间复杂的非线性关系;另一方面通过迁移学习中的监督预训练思想,借助已有细胞类型注释的参考图谱来提高目标数据集的细胞类型识别精度。本文通过一组跨测序协议、跨实验室、跨物种且数据集大小和细胞类型复杂度均不同的五个胰岛组织数据集之间互相迁移的实验,覆盖了不同程度的批次差异情况下本文算法的预测效果,证明了本文的方法即使在目标数据集和参考图谱间存在较大的批次差异时,也能有效地防止负迁移。同时,本文算法通过与三种传统聚类算法和三种深度聚类算法在可视化效果以及聚类评估指标上的比较,验证了本文算法强于现有算法。
其他文献
学位
信息损耗用于表征信息量的消耗,在任何存在信息传递的系统当中,都必须要考虑信息损耗对于系统所产生的影响。我们注意到,当下对于信息损耗的讨论主要都是在白盒系统当中,此时不仅确定信息损耗是容易的,同时规避信息损耗对于系统的影响也是可能的。本文则把研究对象选在了流密码和卷积神经网络这样的灰盒系统中,在这些系统中,由于系统中存在着相当一部分的未知性质,从而为界定系统中的信息损耗,并评估它所产生的影响增加了困
学位
新型冠状病毒的全球爆发,让所有一线教师和学生迅速步入在线教学的战斗行列。随着全球教育信息一体化的发展以及互联网技术对人们日常生活的渗透,人们对于教育教学模式改革的呼声也逐渐强烈。因此,把网络学习和混合式学习的优势与翻转课堂结合起来的新型教学模式逐渐受到重视。基于混合式学习的翻转课堂教学模式,是对居家学习期间,大规模在线教学的实践与反思,也是在后疫情时代,吸取线上教学优势,与线下教学深度融合后,提出
学位
学位
学位
学位
随着教育信息化时代的到来,在线教育平台得到了大规模的应用。在线教育平台中学习者可以随时随地的进行学习,它打破了传统教育模式,将师生互动的空间从现实中课堂拓展到了网络虚拟空间之中。在线教育平台中,在线课程论坛是一个必不可少的功能模块,常常被用于学生之间和师生之间的交流,即在线课程论坛支持学习者随时随地发布问题,及时地反映他们在学习中遇到的问题。在线课程论坛为学习者提供了学习交流的场所,吸引了很多学习
“课程思政”是将思想政治教育融入课堂教学的各个环节中,实现思想政治教育与知识体系教育的有机统一。本研究在明确把握心理与教育测量课程的思政改革目标的基础上,论述了三种改革途径,将思政元素融入本课程教学中,以强化学生的爱国思想和文化自信、培养学生的社会责任感以及科学严谨的专业态度。为保障课程思政的教学改革效果,教师要认可课程思政价值,不断更新思政理念,以学生兴趣为导向,自然渗入思政元素,以多元教学为手