单细胞转录组测序数据的插补方法研究与实现

来源 :扬州大学 | 被引量 : 0次 | 上传用户:sunleilong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的批量转录组测序技术(即Bulk RNA-seq)能够用于估计基因在样本细胞群中的平均表达水平,但缺失了基因在细胞间的表达异质性信息。相比而言,单细胞转录组测序技术(scRNA-seq)可在单细胞水平分析基因表达。scRNA-seq不仅能用于揭示不同类型细胞间的基因表达差异,指导基因调控网络构建、胚胎发育和脑神经研究等,还能为相关药物研发和临床医疗提供重要依据。由于scRNA-seq的起始mRNA数量少和当前测序技术的局限性,往往无法检测到单个细胞中的全部mRNA,最终导致基因表达信息缺失,表现为量化形成的基因表达计数矩阵的稀疏程度较高。其中由scRNA-seq过程的技术原因所导致的计数“0”值被称为“丢失”(dropout)。scRNA-seq数据的高稀疏性可能会影响细胞聚类、差异表达、轨迹推断等下游分析。对此,多种噪声消除(denoise)或插补(imputation)方法开始被用于恢复包含dropout在内的基因表达缺失数据。然而,这些插补方法对基因共表达分析的影响尚未得到系统性研究,同时亟需更为可靠的scRNA-seq数据插补方法。针对以上问题,本文对scRNA-seq数据插补方法进行了详细研究和实现,主要贡献包括:(1)系统分析了不同插补方法对基因共表达分析的影响。通过仿真分别建立了含有“真实”基因共表达信息的同质性细胞群和异质性细胞群的数据集,并利用泊松(Poisson)抽样模拟了 scRNA-seq数据缺失过程,产生了含有dropout的基因表达缺失数据集。后将包括 MAGIC、DeepImpute、scImpute、scRecover、SAVER 在内的多种插补方法分别应用于以上缺失数据集,并对插补前后的基因共表达模式进行了比较分析。实验结果表明,相较于异质性数据,同质性数据在插补后更能够保留基因共表达信息。同时,SAVER在这两种类型数据上的表现均强于其他几种插补方法,即更能够保留基因共表达信息。(2)提出了一种基于自动编码器的scRNA-seq数据插补方法。首先对scRNA-seq数据进行仿真,得到Poisson抽样前后的模拟数据。接着对传统自动编码器进行改造,将每列细胞压缩编码,对scRNA-seq数据进行重构。与传统自动编码器不同的是,这里所使用的损失函数是模拟数据抽样前符合Gamma分布的数据。利用深度学习中的参数学习重构scRNA-seq原始数据,对数据集分组并根据带有相关性的模拟数据训练得到真实的插补数据,减少dropout事件引起的分析误差。实验证明,本文提出的插补方法在恢复基因表达值上有较高准确性,并适用于大规模数据集。综上,本文在系统研究和分析现有scRNA-seq数据插补方法性能的基础上,提出并实现了一种新型的插补方法,以此推动该领域研究的发展。
其他文献
<正>进一步探索如何以中国式的独特民族风格实践完成对新观念、新价值的艺术表达,真正触碰到当代中国的精神脉搏,才是《中国奇谭》出现在中国动画百年历史节点的最大意义所在。2月12日,由上海美术电影制片厂、B站联合出品的动画短片集《中国奇谭》迎来了收官,并以2.1亿播放量、豆瓣评分9.1的优异成绩赢得了热度、口碑的双丰收。的确,民族风格一直是中国动画发展的鲜明标识。中国观众对中国动画的期待,尤其是对内容
期刊
目的:探究评估阴道炎的有效治疗方案。方法:2020年1月至2021年6月为本研究开展时间,样本为就诊38例阴道炎患者,根据患者用药方案差异分为实验组与对照组,两组患者样本数量均为19例,实验组患者用药方案为复发甲硝唑阴道栓,对照组患者用药方案为甲硝唑片,对比分析两组患者治疗效果及各项临床指标。结果:对比两组治疗总有效率及复发率,实验组更具优势(P<0.05);统计两组患者临床症状改善时间,实验组低
以“linux操作系统应用”为例对高职软件专业课程思政教学改革进行研究。从思政课程建设角度出发,提出修改教学大纲和课程标准,深度挖掘思政元素,提升教师德育意识以及价值引领能力,深度研究多元化的融入方式,制定课程思政评价体系,建立激励机制等方式来进行课程思政教学改革,以其为相关人员提供参考。
无线传感器节点由于部署环境而受到严峻的供电限制,这促使其通过低功耗技术来延长使用年限。以温湿度、振动为监测对象,提出了一种能量管理与动态电压调节方法,从软件与硬件上同时降低电流的损耗,系统微控制器采用低功耗芯片STM32L475VET6及低功耗局域网LoRa技术实现远距离通信,主控制器多种模式唤醒工作,系统长周期保持睡眠模式,通过实验测量监测节点在空闲待机模式下仅消耗21.85μA。解决了不稳定监
以2年生小叶黄杨Buxus microphylla叶片为试材,通过盆栽试验模拟自然干旱条件,设置正常供水(田间持水量的80%~90%)、轻度干旱胁迫(田间持水量的60%~70%)、中度干旱胁迫(田间持水量的50%~60%)和重度干旱胁迫(田间持水量的35%~45%)4个处理,监测小叶黄杨不同生长时期的叶片相关酶活性,以期研究干旱胁迫条件下小叶黄杨叶片抗氧化特性的变化特征。研究发现:随着干旱胁迫程度
目的:对复方甲硝唑阴道栓治疗47例阴道炎患者的临床疗效进行观察。方法:将我院在2018年4月起2019年7月止期间所收治的91例阴道炎患者作为此次研究对象,采用随机数法将其分为对照组(44例患者)和观察组(47例患者),治疗方式分别为达克宁栓与制霉菌素相联合的治疗方式以及复方甲硝唑阴道栓治疗,将两组患者的临床疗效进行对比。结果:观察组中,治疗有效率为95.74%,对照组为81.82%,观察组治疗有
以高直链玉米淀粉G50和G70为原料,经酸解、糊化、脱支和重结晶步骤获得Ⅲ型抗性淀粉,通过退火与压热处理以进一步提升淀粉的抗性比例。采用扫描电子显微镜、X射线衍射、差示扫描量热、快速黏度分析等方法,研究淀粉颗粒形貌、结晶结构、热特性及糊化特性,利用Englyst法测试淀粉消化特性。结果表明:高直链玉米淀粉G50和G70酸解后的得率分别为77.9%和84.5%,重结晶后的得率降为54.4%和70.2
海绵城市是解决城市内涝、水环境污染等问题的重要方式,如何在大规模建设轨道交通工程中融入低影响开发理念,落实海绵要素,成为一个亟待研究的问题。本文以结合口袋公园的地铁车站地面附属为研究对象,探讨地下车站地面附属的海绵城市建设思路。
<正>创作说明:行走的途中,发现那些能够让我心动的物象,通过水彩的形式一一呈现。用水彩的形式表现祖国河山秀美,同时水彩的独特性在于颜色携带方便,也可作为速写为创作搜集素材,记录生活。
期刊
频控阵-多输入多输出(FDA-MIMO)雷达通过波束形成技术实现抗干扰的研究已经十分丰富。然而,在实际工作中,受元器件老化和存储设备容量等硬件因素的影响,计算得到的信号协方差矩阵可能会出现数据缺失的情况。为了克服协方差矩阵数据缺失对波束形成算法性能的影响,该文提出了一种基于深度学习的FDA-MIMO雷达协方差矩阵数据恢复方法,并建立了协方差矩阵恢复-自适应波束形成的两阶段处理框架。提出了一种双通道