基于RNA-seq数据的长非编码RNA与癌症关联模式挖掘

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:titan19871102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是目前尚未找到完全治疗方案的一种恶性疾病,而随着对癌症的研究深入,发现癌症的发生本质是由人体细胞中基因的突变引起的。基因通过转录成RNA进而参与细胞生长分化等各项细胞活动,其中长非编码RNA(lncRNA)是一类长度大于200个核苷酸且不编码蛋白质的RNA。研究发现lncRNA与癌症的发生有着密切的关联,但由于lncRNA的数量庞大,且功能复杂,想要通过实验来对癌症中的每个基因进行单独研究将花费巨大的时间和费用成本。因此采用计算的方式来研究lncRNA与癌症的关联模式显得尤为重要。随着高通量测序技术的发展,实验产生了各种类型的生物数据,与癌症相关的数据也是越来越详细和准确,如TCGA数据库和GTEx数据库便记录了各种癌症的相关数据。而这些数据也为各种计算方法的提出提供了可能性,本文正是基于RNA-seq技术得到的基因表达数据来分析和研究lncRNA和癌症的关联关系。本文旨在通过分析处理RNA-Seq数据来设计出一种有效方法来挖掘出与癌症最相关的lncRNA集合,即关于lncRNA与癌症的关联模式,其中癌症的关联模式挖掘包括单个癌症、癌症亚型和泛癌三个层面。我们把编码基因和转录lncRNA的基因作为我们研究的主体,通过不同的尺度变换来分析其表达数据的基本特征。通过基因特征分析和样本相似网络构建的结合来挖掘单个癌症和泛癌层面的关联模式;通过单个癌症的关联模式建立样本关联网络,通过关联网络的模块划分来挖掘潜在的癌症亚型及其对应的关联模式。本文通过差异表达分析得到的基因来对比验证本文的实验方法,发现在本文方法得到的癌症关联模式中的基因集合在区分癌症类型上效果更好。然后通过GO功能注释和KEGG通路富集分析来验证模式中基因的生物学功能,最后通过在线数据库Lnc2Cancer 2.0和Lnc RNADisease对乳腺癌关联模式的基因集合进行验证,得到6个已被证实与乳腺癌相关的lncRNA,其中包括BANCR、FOXC2-AS1、H19、LINC00704、NCRMS、RMST。总之,本文提出的研究方法在与癌症相关lncRNA的关联模式挖掘上效果显著,可以根据本文得到的癌症关联模式中的基因集合进行进一步的实验探索。另外,本文发现通过合适的尺度看待基因的表达时,会发现与癌症强相关的基因在正常样本中表达最混乱,而在癌症样本中表达相对稳定一些。这一结论有助于后续的生物实验研究,以便进一步分析癌症发生过程中lncRNA所发挥的作用,为癌症的发现和治疗提供帮助。
其他文献
随着新世纪经济与科学技术的飞跃发展,也相续产生着许多形态各异的文化艺术作品。影视是一种新兴的文化形态,尤其动画影视在近年的飞速发展,许多国家试着将自己的文化精髓以动画影视艺术的方式去表现,逐渐形成了新世纪文化传播的一种主要方式。对我们藏族而言,已经迈出了藏语电影创作的步伐,藏语动画影视的创作处于初级阶段,所以不仅作品罕见,投入创作领域的专业人才也极其稀少。虽说藏族动画电影的发展较为滞后,但近年也出
为建设海洋强国,船舶导航领域的发展广受关注。目标检测在船舶导航领域发挥着重要作用,检测准确度和检测时长等指标在路线规划、有效避障等方面有着重要意义。传统目标检测方法多基于恒虚警率技术,但其应用在X波段导航雷达目标检测中,往往需要逐点进行检测。本文依托于国防科研项目“舰载X波段航海雷达反演海浪技术”,针对传统目标检测方法在数据量较大时检测时间较长、检测器性能无法保证的问题,基于大量X波段导航雷达海上
近红外光谱法(near infrared spectroscopy,NIRS)是一种快速无损的分析技术,建立稳健可靠的模型是近红外(near infrared,NIR)应用的前提。近红外定量模型的建立包括样本集的划分、光谱预处理、变量筛选、校正等过程,各建模过程中包含多个建模参数,选择最佳的建模参数有助于提高模型的准确性和稳健性。现有文献中多以模型的预测结果为评价指标优选建模参数,缺少对参数稳健性
环保装备制造业是适应环境保护的需求而兴起的新兴产业,是环境保护的装备基础和技术保障,是推动环保产业发展的途径。本文应用波特的"钻石模型",从生产要素、市场需求条件、
近年来,机器学习和计算机视觉检查方法已广泛应用于缺陷检测领域。由于工业产品的表面缺陷会对产品的美观度、舒适度和使用性能等带来不良影响,因此产品表面缺陷的检测对生产企业来说尤为重要。机器学习检测方法的运用可以很大程度上克服人工检测方法存在的弊端,如人工抽检存在的准确性低、实时性差等问题。由于有缺陷的样本数量稀少,因此样本收集往往面临样本量小和样本类别失衡问题,导致大多数现有的机器学习检测方法无法在工
立足我国当前轻微刑事案件递增的犯罪态势,我国刑事司法体制在推进以审判为中心的诉讼制度改革的同时,也在优化司法职权配置,完善刑事诉讼中认罪认罚从宽制度,以解决“案多人少”的结构性矛盾。在认罪认罚从宽制度的立法设计中,作为贯穿认罪认罚从宽制度的红线,量刑建议不仅是控辩合意的产物,反映控辩双方关于定罪量刑的基本共识,也对最终裁判具有实质性影响。故此,为推动量刑建议的精准化,检察机关依据《刑事诉讼法》第1
学位
目的:肝细胞癌(hepatocellular carcinoma,HCC)是我国常见恶性肿瘤之一,死亡率仅次于胃癌和食管癌,5年生存率不足5%。流行病学和实验研究均表明慢性病毒性肝炎与原发性肝癌的
运动目标的位置姿态监测是许多空间应用的基础,尤其在计算机视觉,摄影测量等相关领域有着广泛应用,重要性不言而喻。然而,在实际应用场景中,被观测目标和探测器之间总是不可避免地存在散射介质。光子在随机散射介质中的“随机行走”使得“所见即所得”的光学成像系统难以对隐藏在雾霾、毛玻璃和生物组织后方的目标进行有效成像和探测。近年来,国内外学者相继提出了波前调制,光子计数,散斑相关等成像技术来解决透过散射介质成
股票投资是现代经济活动的一个主要方面,股票市场在资本融通、资源的有效配置、金融资产的价格发现以及社会财富的再分配中发挥着重要作用。由于股票市场受多种因素的影响,股票价格表现出明显的非线性、不确定的特点,股票的暴涨暴跌使得金融市场极大动荡,直接影响了金融市场的稳定和发展,也对投资者的收益产生重要影响。如何找到一种方法来较准确地预测股票,并对股票市场进行合理的控制和健康的引导,这对我国未来国民经济的发
随着工业4.0时代的来临,信息化技术不断推进产业进行变革。工业大数据蓬勃发展,通过众多传感器、控制器等设备采集的大量数据为故障预测与健康管理(Prognostics and Health Management,PHM)技术提供了数据支撑。PHM可以智能地对工业设备运行状态进行分析并精确诊断故障,能够大幅度提高运维的效率,减少设备运行的不确定性。近年来,人工智能中的机器学习、深度学习等技术被广泛用于