基于相对表达秩序关系的差异基因识别方法研究和应用

来源 :福建医科大学 | 被引量 : 0次 | 上传用户:youkangstrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:鉴别两种不同处理条件下或者不同表型之间的差异表达基因(Differentially Expressed Genes,DEGs)是高通量基因表达谱分析的基本任务。先前我们实验室开发了基于样本内相对表达秩序关系(REOs)的Rank Comp算法,能够用于群体和个体水平差异表达基因的识别,具有对批次效应不敏感等优点。Rank Comp算法中采用Fisher精确检验对列联表进行显著性水平计算,评价处理条件或表型与稳定基因对在两组中的分布是否存在显著相关性,然而没有意识到基因对在两组中表达秩序关系是一种配对的实验设计关系,存在检验方法适用错误的问题。方法:本论文对Rank Comp算法进行了改进,采用Mc Nemar-Bowker检验替代Fisher精确检验,开发了Rank Comp V3算法并将该算法推广应用到单细胞转录组差异表达基因的识别中。本论文从多个角度评价Rank Comp V3算法的性能,并探索其应用,包括:(1)使用多种平台测量的Null数据集,评价Rank Comp V3的假阳率,包括基因芯片、转录组测序(RNA-seq)以及单细胞转录组测序(sc RNA-seq)数据;(2)将Rank Comp V3应用于基因芯片和RNA-seq的基准数据集,MAQC和SEQC,以Taqman测量结果作为“金标准”,评价算法的AUC值;(3)使用模拟的sc RNA-seq数据集,评价Rank Comp V3的真阳率和真阴率;(4)将Rank Comp V3应用于sc RNA-seq数据集GSE29087中,采用芯片数据获得的Top 1,000差异基因作为“金标准”,评价算法的精度和AUC值;(5)将Rank Comp V3应用于差异信号微弱的乳腺癌基因芯片数据集,并分析识别到的差异表达基因的功能;(6)将Rank Comp V3应用于造釉型颅咽管瘤的sc RNA-seq数据,并对识别到的差异表达基因进行功能富集分析。结果:本研究采用多个不同数据集从不同的角度对Rank Comp V3算法识别差异表达基因的性能进行评估,包括:(1)分别在Null数据集的每一类样本中识别差异表达基因,以评估算法的假阳率。本研究发现:在数据集GSE54695的4类样本中,Rank Comp V3的假阳率小于0.01%。而在先前的一项比较多种差异识别算法的研究中,所有算法的假阳率均高于Rank Comp V3;其中,Monocle2算法的假阳率最高,达到7.32%。(2)本研究采用Taqman测量结果作为“金标准”,发现Rank Comp V3在SEQC数据集中的AUC值达到0.94。先前的一项研究比较了六种不同算法在SEQC数据集中的性能,发现Linnorm算法的AUC值最高,但仍低于Rank Comp V3算法。(3)对于模拟的sc RNA-seq数据集,Rank Comp V3的性能优于多种差异识别算法,具有较高的精度和准确率以及极低的假阳率。(4)对于sc RNA-seq数据集GSE29087,先前的一项研究发现多种算法的真阳率虽然高于0.700,但由于算法识别的差异表达基因数目很多(皆大于7,500),导致其精度较低(最高仅为0.091)。而Rank Comp V3识别到587个真正的差异表达基因,其精度达到0.105,优于多种真阳率较高的算法。(5)对于差异信号微弱的乳腺癌芯片数据集,一些常规的差异识别算法识别不到或者仅识别到极少的差异表达基因,而Rank Comp V3识别到的差异表达基因富集到与癌症相关的通路;(6)本研究分别将Rank Comp V3算法应用于造釉型颅咽管瘤的sc RNA-seq数据集,并对差异表达基因进行KEGG功能富集分析,结果发现多个与癌症相关的通路被显著富集。创新点:本研究考虑到基因对的表达秩序关系在对照组和实验组中是配对的实验设计关系,故采用Mc Nemar-Bowker检验识别差异表达基因,这降低了算法的假阳率;并且,与Rank Comp算法不同,Rank Comp V3算法不仅适用于芯片和RNA-seq数据,同时也适用于sc RNA-seq数据。结论:本研究利用Mc Nemar-Bowker检验,基于REOs开发了一种差异表达基因识别算法Rank Comp V3。不管是针对芯片数据和RNA-seq数据,还是sc RNA-seq数据,Rank Comp V3都具有较好的性能,并且对批次效应不敏感。
其他文献
学位
目的介绍一种即微创又有效的阴道紧缩手术。方法采用打孔器在会阴处打6个小孔,将2根双向倒齿线经小孔对盆底肌肉行双菱形法缝合,收紧盆底肌肉,缩小阴道口。结果本组20例患者手术时间为30~40 min,平均35 min。出血量较少,无瘢痕形成。获随访6个月,性生活满意度较术前有所提高。结论采用双菱形缝线法阴道紧缩术,设计科学,损伤小,不遗留瘢痕,且并发症较少,是改善阴道松弛及提高患者性生活质量的简单而有
"三全育人"是新时代下高职院校人才培养必须遵循的教育理念和实践路径。以新商科教育为例,高职院校应准确把握"三全育人"内涵体系及实践要求,在教育系统论视域下实施大思政教育,从构建服务产业高端的高水平专业群,搭建"思想领航·技术引领"的专业课程体系,搭建"素养嵌入·项目贯通"实践育人体系,打造一体化"匠心财经"文化育人品牌,打造"铸魂强师"教育工匠团队,创新基于学生职业能力画像的教育评价模式等方面重塑
利用IPCC经典碳排放计算理论, 基于农资投入、农田利用及畜禽养殖3类主要碳源, 测算了山东省2000—2020年农业碳排放量, 采用LMDI模型开展影响因素分析, 并运用灰色预测模型GM(1, 1)预测2020—2045年碳排放量。结果表明: 2020年山东省农业碳排放量为1.58×107 t, 农业碳排放强度0.205 t·(104¥)-1。2000—2020年山东省农业碳排放总量呈先上升后波
作为一个新兴的资本市场,我国资本市场发展时间短,发展势头迅速,有极大的发展潜能。然而,目前我国上市公司信息披露及财务审计制度还很不完善,存在着诸多上市公司财务舞弊行为。根据证监会通报数据显示,2020年将重点打击财务舞弊案件,全年共进行财务舞弊立案33起。而其中,作为央企,a股上市公司航天通信控股的子公司智慧海派在开年不久就因为涉嫌财务舞弊而被证监会立案调查,引起了投资者极大关注。为增厚利润,寻找
目的:探索患者SUFU(rs17114808)单个核苷酸多态性位点(SNP)的不同基因型对地中海贫血患儿异基因造血干细胞移植后GVHD(Graft-versus-host Disease,移植物抗宿主病)的影响。方法:对2018年10月至2020年11月在厦门大学附属中山医院血液科进行异基因造血干细胞移植的44例地中海贫血患儿进行基因型检测,在预处理前采集外周血标本,送检提取外周血基因组DNA,采
目的分析本院高毒力肺炎克雷伯菌(hypervirulent Klebsiella pneumoniae,hvKP)的检出情况、耐药性、黏液表型、毒力基因型、荚膜血清型以及多位点序列分型(Multilocus Sequence Typing,MLST)等,为本院hvKP感染的防控及精准诊疗提供依据;利用蛋白组学探索可区分hvKP与经典肺炎克雷伯菌(classic Klebsiella pneumon
目的:通过回顾性分析288例因宫颈高级别鳞状上皮内病变(high-grade squamous intraepithelial lesion,HSIL)住院行宫颈冷刀锥切术(cold knife conization,CKC)治疗患者的临床资料及术后随访情况,了解本院HSIL患者基本特征,探讨影响手术切缘状态的因素,并分析其中220例单纯行CKC患者术后复发的危险因素。检测宫颈病变中自噬相关基因(
近年来,印尼政府对汉语教学管制的放松,使得汉语教学在印尼得到了一定的发展,2019年印度尼西亚西努沙登加拉省开展“千人计划”的来华留学项目,计划五年内向中国派送千名留学生来华留学,当地对于汉语教师的需求不断增加。本人作为被派往西努沙登加拉省龙目岛真理基督学校的首批志愿者,在教学过程中不可避免地遇到了许多跨文化交际问题。案例分析是研究跨文化交际问题的一种行之有效的方法,本文呈现了笔者在真理基督学校任