论文部分内容阅读
miRNA(microRNA)是一种在癌症和肿瘤等生命过程发挥非常重要调控作用的长度约为19-24nt小分子非编码RNA,它的作用原理是通过碱基互补配对靶向靶基因mRNA,抑制mRNA的表达或者将mRNA降解。目前miRNA在癌症或肿瘤等疾病中的调控机理已经在生物学研究领域受到了科研人员的广泛关注,但是现阶段对miRNA与疾病调控关系的研究主要是通过基因碱基序列比对以及生物学特征统计的方法,而这些方法都有着相同的缺点即需要花费大量的时间和资金。因此,为了克服这些缺点,我们转换思路,尽可能减少花费资金和时间都较多的生物学实验环节,转而从已有的基因表达数据中分析出miRNA与疾病以及靶基因的调控关系。本文结合TCGA数据库提供的肾细胞癌(RCC)中miRNA和mRNA表达数据,分别从展开三个方面的工作。(1)用统计学的方法对肾细胞癌的miRNA与mRNA进行相关性分析,并比较其相关性在健康人(control组)和肾细胞癌患者(case组)之间的差异来预测可能调控肾细胞癌的miRNA。(2)新近研究表明多种miRNA如mir-155,mir-21,mir-106a,mir-106b,mir-200b,mir-210,mir-141,mir-182,mir-200c和mir-192[4-9]等都参与了肾脏疾病的病理生理过程,本文将这些miRNA分成参与调控肾细胞癌(RCC)和不参与调控肾细胞癌两类,从表达数据选择一定的特征并通过SVM的方法进行训练、建模和交叉检验以预测miRNA对RCC是否具有调控作用。(3)本文还依据TargetScan网站所提供的特定miRNA靶基因数据,根据mRNA是否为miRNA的靶基因将miRNA和mRNA之间的关系分成两类,从miRNA和mRNA表达量数据中选择三个特征即miRNA表达量均值与mRNA表达量均值之差、miRNA表达量均值与mRNA表达量均值之比和miRNA表达量的方差与mRNA表达量的方差之比,同样用SVM方法进行训练、建模和交叉检验以预测miRNA和mRNA是否具有靶向关系。实验结果表明,通过相关性分析预测出miRNA与肾细胞癌之间的调控关系具有较高的参考价值,同时特征选择SVM方法对miRNA和肾细胞癌的调控关系以及对miRNA靶基因的预测上都有很高的预测正确率。以上结果都预示着基于基因表达数据分析在miRNA与疾病以及靶基因关系的研究中有着很好的前景,不仅具有较高预测正确率,而且克服了生物学实验方法的周期长、花费高以及可控性差的缺点。同时随着miRNA和mRNA数据的不断补充,基于表达数据分析的方法不仅能够快速预测miRNA与其靶基因mRNA的调控关系,同时还能为生物信息学的研究提供更多的可能性。