单样本基因集分析方法的基准研究及其在呼吸疾病上的应用

来源 :广州医科大学 | 被引量 : 0次 | 上传用户:jzymw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:使用常用的基因集富集分析方法处理分析存在异质性和样本/病患特异性的数据集时会给分析结果引入系统误差,因此近几年有许多研究人员设计开发了一系列用于识别单个或异质样本中通路活动等的单样本基因集分析方法。那么对于不熟悉单样本基因集分析方法的生物学家来说,如何从这些已有的备选方法中选择最合适的分析方法是一个重要问题。目前的各类研究中,缺乏对已有单样本基因集分析方法工具的评估和比较。因此本研究旨在基于基因集分析方法理论,对所选6种单样本基因集分析方法在灵敏度,特异度和精确度方面进行比较研究,为数据分析方法的选择提供新的思路。方法:在GEO数据库中检索筛选8个与呼吸疾病相关的数据集,作为基准评估研究中的“金标准”测试数据集,并且选定的疾病相关数据必须具有已知的生物学功能注释的基因集(信号通路),能够作为参考靶向通路(Target Pathway)。结合生物学研究结果,比较6种单样本基因集分析方法结果中的有统计学意义的基因集与已知的生物学研究证据(靶向通路)的符合程度,然后计算灵敏度,特异度和精确度,最后进行客观评价。为了使基准研究便于记录、利用和传阅,使用Jupyter Notebook记录流程;并通过动态网页Shiny工具便于其他研究人员比较分析和选择方法。选择最佳基因集分析方法对2个实验数据集(COPD相关数据集GSE36221和COVID19相关数据集GSE147507)进行实例分析比较。结果:在基准研究中,GRAPE和Pathifier的灵敏度和精确度优于其他方法,而G SVA和ZSCORE在特异性上表现优异。然而Pathifier的计算时间过长,因此综合比较这6种方法,GRAPE的表现最佳。本基准研究的整个工作流程和名为“ss-shiny”的Shiny网页使用教程已经公布在网页:https://gsa-central.github.io/bench marKING。在实例分析研究中,对GRAPE方法进行应用探索,其分析结果在一定程度上能够准确的检出疾病相关的通路,与其他分析方法相辅相成。结论:目前研究人员对单样本基因集分析方法的性能了解不足,我们的基准研究表明,具有极高精确度的基因集分析方法不一定有着极高的灵敏度。综合研究结果来看,Pathifier和GRAPE为最佳的单样本基因集分析方法,这个结果和近期另一个比较研究的结果相一致。我们致力于基于Jupyter Notebook和Shiny应用(ss-shiny)创建生物信息学工具,使单样本基因集分析方法的基准研究变得更加明了。后续实例分析表明单样本基因集分析方法并不是唯一的分析方法选择,基准研究所得最优法GRAPE在分析复杂的COPD数据集时,提供了与传统的Web分析平台(Enrichr)的互补结果;在分析在COVID-19数据集时,对原作者未提及的结果进行了补充。
其他文献
目前,民航发动机故障诊断方法在处理复杂的发动机数据时,往往需要结合工程师的经验,导致模型的效率较低,且诊断正确率有待提高。深度置信网络(Deep Belief Networks,DBN)属于
太阳能作为一种清洁能源,具有无污染、可再生等优势,在新能源领域备受关注,被认为是最具有发展潜力的新能源之一。光伏发电系统能将太阳能转换为电能,光伏电池作为光伏发电系
脑机接口(Brain Computer Interface,BCI)是一个涉及认知神经科学、控制理论、人工智能等多个学科的跨学科研究课题。在不依赖人体的外周神经和肌肉的情况下,直接通过脑电信
实时检测道路中的车辆并统计其数量是道路监控系统的重要任务之一。道路上车流量较大时,车辆之间相互遮挡,图像检测算法难以对道路监控视频中的车辆做到实时准确的检测。为此
ZrO2由其优异的物理化学性质,如高硬度、低热容及热导率、高的热膨胀系数、高熔点、稳定的化学性质和较好的抗腐蚀性能等,被视为优异的热障涂层材料之一。其中,纳米ZrO2粉末
董事责任保险是专门为具有经营决策权的公司董事和高级管理人员设计的保险产品,使董事和高级管理人员在执行职务时,能够从容面对复杂多样的经营风险。这是因为董事和高级管理
忆阻器因其结构简单、集成度高、器件功耗低、擦写速度快且制备工艺与当前的CMOS工艺兼容等优点,被视为下一代非易失性存储器中最具竞争力的候选者之一。然而,迄今为止,因材
生物絮凝剂是从微生物或其分泌物中提取获得的高分子代谢物,具有一定的凝聚性。与传统絮凝剂相比,生物絮凝剂具有生物可降解性、高效、无毒和无二次污染等特性,对人类健康和
科技化时代加速了我国城市化发展进程,许多城区内都涌现出密集的高层建筑,现有的移动通信技术不能对这些高层楼宇密集区域进行高质量连续覆盖。为了进一步推动城市立体化发展
文安油田主要有4个典型的断块油藏,本文通过各断块统层对比研究,对小层进行了进一步的精确对比,在同一沉积背景、同一标准层的前提下建立了小层统一划分方案;通过对各断块沉