利用TCGA数据库构建肾透明细胞癌相关miRNA预后模型

来源 :生物信息学 | 被引量 : 0次 | 上传用户:iqwanifir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用TCGA数据库中肾透明细胞癌的miRNA与mRNA数据及临床信息,构建由miRNA组成的预后风险评分模型,并筛选与生存预后相关的miRNA-mRNA调控关系对,为研究提供理论依据.下载并整理TCGA数据库中肾透明细胞癌的miRNA与mRNA数据;对数据进行差异分析,将差异表达的miRNA与临床信息进行合并,利用单因素与多因素Cox回归分析,构建预后模型并进行模型评价;对模型中的miRNA进行靶基因预测,结果与差异表达的mRNA进行取交集,构建miRNA-mRNA调控网络;对网络中的mRNA进行生存分析,筛选生存相关的miRNA-mRNA调控关系对.共得到49个差异表达的miRNA与3613个差异表达的mRNA;预后模型计算公式为:风险值(risk score)=hsa-miR-21-5p表达量×0.603+hsa-miR-1251-5p表达量×-0.093;调控网络中共纳入31个miRNA-mRNA调控关系对;对mRNA进行生存分析,共得到7个有价值的关系对.所构建预后模型可有效预测肾透明细胞癌患者生存预后情况,筛选到的miRNA-mRNA调控关系对可为相关研究与治疗提供参考.
其他文献
为分析甲状腺癌基因表达谱,筛选疾病相关的基因标志物.基于肿瘤基因组图谱(TCGA)数据库中的甲状腺癌基因表达数据,运用R/Bioconductor统计平台进行数据处理与统计学分析.分别应用edgeR算法和limma算法选取肿瘤组织与对照组间倍数改变>2,P<0.05的基因作为差异基因;进一步运用Medcalc统计软件进行受试者工作特征曲线(ROC)分析,鉴定出有诊断标志物潜在应用价值的基因标志物.通过两种运算方法筛选出甲状腺癌组织中存在着1945个差异基因(上调基因1033个,下调基因912个);根据差异
在“尿的形成和排出”一节教学中,通过创设不同情境,引导学生主动探索,掌握知识背后的逻辑及意义,并实现迁移应用,帮助学生初步树立生命观念、培养科学思维和社会责任,最终发展核心素养.
近年来,随着高通量染色体构象捕获(Hi-C)等技术的发展和高通量测序成本的降低,全基因组交互作用的数据量快速增长,交互作用图谱分辨率不断提高,促使染色体和基因组三维结构建模的研究取得了很大进展,已经提出了几种从染色体构象捕捉数据中构建单个染色体或整个基因组结构的方法.文中通过对在Hi-C数据基础上对染色体三维结构重建的相关文献进行分析,总结了重建染色体三维空间结构的经典算法3DMax的原理,并且提出了一种新的随机梯度上升算法:XNad-am,是Nadam优化方法的一个变体,将其应用于3DMax算法中,以便
结构变异作为人类基因组上的一种大规模的变异类型,对分子与细胞进程、调节功能、基因表达调控、个体表型具有重要的影响,检测群体中基因组结构变异有助于绘制群体基因组变异图谱,刻画群体遗传进化特征,为疾病诊治、精准医疗的发展提供支撑.本研究提出一种面向高通量测序的群体基因组结构变异检测工作流,该工作流通过使用多种高性能基因组结构变异检测算法实现全面、精准的结构变异挖掘,使用多层融合与过滤获得高精度群体结构变异候选集合,利用基因型重新校正、变异修剪、类型校对,最终完整绘制群体基因组结构变异图谱.基于该工作流对由26
探索了多种植物在初中光合作用系列实验中的应用,通过改进实验方法、创新实验装置,优化了实验效果.实验过程操作简单、实验现象直观明显,让学生能真正参与到实验探究活动中,促进了生物学学科核心素养的发展.
脑胶质瘤(Glioma)是最常见的中枢系统恶性肿瘤,MAML2是NOTCH信号通路的共激活因子,通过癌基因组数据库(TCGA)分析验证MAML2基因表达及相关临床参数与低级别胶质瘤(LGG)的诊断及预后价值.从癌基因数据库LGG数据库中下载患者基因表达量数据及患者临床数据,采用统计学方法验证MAML2基因表达差异及临床参数与胶质瘤的诊断与预后关系.在TCGA LGG队列中,发现LGG组织中的MAML2基因较正常组织明显上调(P<0.001),其差异表达可作为低级别胶质瘤的潜在诊断标志物.同时,MAML2低
基于专用集成电路(ASIC)的光数字信号处理(ODSP)设计可以有效提高光传输芯片的传输容量.本文主要解决的问题对ASIC性能和资源进行权衡,实现具体场景下的DSP芯片的算法最优设计.首先我们对整个通信系统进行搭建,进一步讨论不同导频插入、不同插值算法、不同导频调制值以及导频样式对系统性能以及导频开销的影响,以RSNR代价<0.3dB为目标,设计了一套载波恢复算法,使得导频开销最小.此外,我们对系统性能和资源进行分析,利用Q学习算法构造性能和资源的综合代价函数,给出了一套自动优化位宽和实现性设计的方案,仿
前期研究在植物根际促生菌土地类芽胞杆菌(Paenibacillus terrae)NK3-4中发现一个EsxA编码基因,为明确该基因编码的蛋白的性质、结构及系统发生关系,对该基因进行了生物信息学分析.分析表明,该EsxA含有91个氨基酸,分子质量10276.53 Da,理论pI 5.29,分子式为C445H711N125O146S4,弱酸性,亲水,具有WEG保守基序,属于WXG超级家族成员;建模预测表明,自然状态下EsxA形成不对称的同源二聚体,其中每个亚基都由一个β折叠连接两个α螺旋组成,两个α螺旋反向
分析黑龙江省气象因素与猩红热发病的关系,建立时间序列模型,为今后制定更科学有效的猩红热防控策略提供参考依据.收集黑龙江省2010~2020年猩红热月发病数据以及同期气温、气压等气象资料,应用广义相加模型分析气象因素与猩红热发病之间的关联程度和形式.结果发现:猩红热全年均有发病而且呈现出较为典型的双峰型特征,在春季的4~5月份和冬季的11~12月份发病数达到高峰;月平均气压、月平均相对湿度、月日照时数和月平均风速的P值均小于0.05,表明具有统计学意义.同时,RR(相对危险度Risk Ratio)值均小于1
借助科技论文命制生物学试题,既能保证问题情境的真实性和科学性,又能体现学科的应用价值.明确了借助科技论文命制试题的基本步骤;明确考查的素养指标;构建双向细目表;挖掘科技论文中的命题素材;剔除冗余信息、精简表述词语;设计层次性的问题;明确“双位编码”的评分标准,并对初中生物学原创试题的命制进行了尝试和探索.