组学研究样本量的综合评估与计算及在线工具开发

来源 :重庆大学 | 被引量 : 0次 | 上传用户:nolva
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过高通量技术的应用,组学研究已经可以同时测量成百上千特征表达值的改变。然而,虽然组学研究在生物医药、疾病等领域取得了一系列的成功,但是也出现了一些问题严重阻碍着组学的进一步发展与进步。这些问题包括研究的统计功效过低、结果重现性较差等问题。这些问题的出现得到了极大的关注,并且被认为是多种原因的结果。有研究人员提出,在这些原因当中,样本量是解决问题的关键。在组学研究中,样本量是一个关键因素,它意味着该项研究科学性与伦理性的平衡。如果一个研究的样本量过小,则会影响该研究发现真正的科学问题,最终导致时间和成本的浪费;而相反,如果研究的样本量过大,则意味着在实验中投入了过多的样本,提高了研究的成本,特别当研究有潜在危害性时,还会引起伦理问题。因此,在组学研究中有必要进行样本量的评估与计算。统计功效、分类准确率及结果稳定性分别从不同角度对组学研究的样本量进行评估。统计功效能够反映该项研究的灵敏度,它是指一项研究发现组间差异的能力。分类准确率是指通过组学发现的生物标志物所建立预测模型的预测准确率,一般用AUC、ACC等来表示。结果稳定性表示发现标志物的可重复性,即针对同一疾病所建立标志物的一个性能评估,可以通过Overlap,Concordance,Weighted Consistency等标准来进行评估。考虑到这三项指标之间相互补充,缺一不可,能够对组学的样本量进行综合的评估与计算,满足组学研究的需要,我们开展了以下工作:首先,对不同数据在相同样本量下的指标数值进行对比研究,结果表明,在样本量评估时,不同数据之间相互独立,这一结论通过对不同数据达到相同指标阈值所需要的样本量进行对比得到了进一步验证,因此,我们认为在进行样本量的评估计算时,不存在一个数值对组学研究的样本量进行笼统的概括,而应该针对不同的数据进行相应的研究。然后,我们对同一数据达到不同指标阈值所需要的样本量进行比对,发现结果会随着指标的不同而不同,而且数值之间不存在相关性,指标之间相互独立。同时,我们对18组来源于不同组学数据的样本量进行计算,发现满足不同指标阈值所需要的样本量的大小顺序之间不存在一定的规律,因此无法简单的将某一指标作为最宽松或最严格标准来看待。因此,在进行样本量的评估与计算时,我们建议应该采用多指标、综合的研究。最后,我们借助R‘shiny’包构建相应的在线工具——SSizer,用于进行组学样本量的综合评估与计算。SSizer整合了三种指标(统计功效、分类准确率、结果稳定性)共六项标准(Power,AUC,ACC,Overlap,Concordance,CW),以及多种数据预处理、分析算法,为满足不同研究的需求。同时,通过准确的数据模拟算法的引入,SSizer能够基于上述三项标准对相应研究的样本量进行计算,从而帮助后续研究更好地开展,使研究在拥有足够样本量的前提下进行。综上所述,本次研究从组学样本量出发,基于三种常见指标,对组学样本量进行综合地评估与计算,并在此基础上,建立相应的在线工具,帮助科学家们更好地从研究中发现生物学问题,促进生命科学、生物医药领域的进一步发展与进步。
其他文献
目的:本研究的目的是通过Meta分析的方法回顾相关文献,比较头颈部缺损重建中选择颈内静脉系统与颈外静脉系统吻合皮瓣的血栓形成及失败率之间的差异,为临床治疗方案的选择提
目的:各型巨噬细胞在不同微环境中的功能状态目前尚不完全清楚,本课题比较研究CD163/TWEAK/Fn14途径对M1及M2型巨噬细胞NF-κB的差异表达。方法:提取APOE-/-小鼠腹腔巨噬细胞
丧葬文化是我国传统文化的重要组成部分,墓地是丧葬文化的重要载体。由于我国人多地少的现实性问题以及老龄化进程的不断加快,“天价墓地”越来越被人们所关注。但我国目前关
研究背景动脉粥样硬化是血管壁的轻度慢性炎症反应性疾病。随着经济的发展,人们生活方式的改变,动脉粥样硬化的发生率越来越高,严重危害着人们的身心健康。我们最近的研究表
microRNA是一种内源性短链非编码小RNA,其长度一般在22-24 nt。研究表明microRNA在脂肪细胞分化和脂肪代谢中发挥着重要作用。miR-9-5p调控了多种癌细胞、肝细胞和纤维细胞的
【目的】越来越多的流行病学研究显示:细颗粒物(PM2.5)是许多肺部疾病的重要危险因素,尤其是支气管肺癌,但其具体致癌的机制仍未阐明。本研究重点探讨PM2.5颗粒促进肺癌发生
新型能量存储材料一直是材料研究领域的热点,而超级电容器作为一种新型的储能设备,由于具有充放电快、功率密度大和循环稳定性高等优点,已经被广泛应用于各种能源存储领域。利用生物质、废弃建筑材料等含碳材料为碳源,制备多种新型功能化碳纳米材料是提高超级电容器能量密度的有效方法,也是实现可持续发展理念的重要创新。本文利用含碳废弃物制备了新型MnO_2/碳纳米复合材料,有效提高了MnO_2的储能表现。本文的主要
铬渣是铬盐生产过程中产生的一种危险固体废物。电动法具有高效率、环境友好的特点,被认为是处理铬渣的有效方法。但由于电动法的电流效率低、能耗高,限制了该方法的应用。为
研究背景:2型糖尿病(type 2 diabetes,T2D)是目前最常见的慢性代谢性疾病,已经成为中老年患病和死亡的第三大主要病因。然而据统计学研究表明,几乎所有糖尿病患者中只有一半(
研究背景:胰岛移植是治疗糖尿病的最佳办法之一,具有永久替代胰岛素注射、安全、并发症少的优势。但供体稀缺,移植胰岛长期存活率不高是制约胰岛移植发展的主要因素。移植术