双线性分析与联合假设检验在基因分析中的应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lianglianghepan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
microRNA简称miRNA,是一类长约22核苷酸(nt)的非编码的单链RNA分子,由约70nt的前体miRNA(pre-miRNA)经Dicer酶剪切而来。miRNA参与生命过程中一系列的重要进程,包括发育、造血、器官形成、凋亡和细胞增殖,甚至是癌症发生。目前人类基因组中已确认的miRNA约500个,其中至少有200多种miRNA序列与癌症发生有关。RNA干扰作为近年来的重大科学发现,如今对于这种起抑制蛋白合成作用小分子RNA的研究已成为分子生物学领域的热门。从研究利用RNA干扰技术来阻滞癌症等疾病开始,越来越多的线索表明miRNA与癌症之间存在着密切的关系。联合假设检验(Integrative Hypothesis Test,IHT)和双线性分析(Bilinear Analysis)近来被提出用于研究假设检验,分类和特征选择。双线性分析基于多元判别分析,将原有的基于向量的判别分析推广到基于矩阵的判别分析。本文除了将IHT用于识别miRNA在肺癌和慢性阻塞性肺病Chronic Obstructive Pulmonary Disease(COPD)上的差异表达之外还提出一种基于bootstrapping的方法来改进IHT给出的来源于小样本和缺失值问题,并提高基因排名的可靠性。我们在GEO公开肺癌数据集GSE24709的实验中,已经被报道过的14个差异表达miRNA在单个基因分析的枚举结果中重新得到了确认。除肺癌数据集之外,还利用同时具有癌和癌旁数据集GSE6857肝癌数据集对双线性分析方法进行了研究。通过分析,miRNA对基因的差异表达影响也通过枚举之后得到的p值,分类错误率和相关系数得到了检验,可以借助这些信息进一步识别出具有核心功能的miRNA。另外,文中除了对单个基因进行研究外,将基因两两组合的研究进一步发掘了miRNA之间的联合关系,发现潜在的连接团对两类疾病的区分有一定的联合作用。最后我们通过生物路径分析和相关文献查阅,发现通过联合检验得到的结果在已有研究中得到印证。
其他文献
辣椒(Capsicum annuum)是一种重要的蔬菜和工业原料作物。在我国及世界各辣椒产地,由辣椒疫霉(Phytophthora capsici)侵染引起的辣椒疫病危害严重,对其产量和生产效益造成巨
炮风洞能够产生高超声速流场,是一种极其重要的研制高超声速武器的空气动力学地面试验装置。活塞作为炮风洞的重要部件之一,其综合设计品质不仅直接影响风洞试验数据,而且活
黄龙病对柑橘产业具有毁灭性伤害.动力学模型有利于更好地研究疾病传播规律,进而评价疾病的防治效果.为了评估季节波动、交叉保护及移树等控制措施对黄龙病传播规律的影响,我
计量异常监测是用电信息采集系统的一个重要功能,可对用电现场的电量异常、电压电流异常、异常用电、负荷异常、时钟异常等多种异常情况设置报警标志,并生成相应的计量异常事
水稻毯状小苗机插技术源于日本,经过本土化改进后迅速发展,但我国地形复杂、种植制度多样,在稻麦、稻油、双季稻等多熟制种植地区,水稻生育期延迟造成上下茬口衔接紧张,易出
1,2,3-三氮唑类化合物以其独特的氮杂环结构而拥有特殊的物理化学性质及良好的生物活性和低毒性,使其在有机化学、有机金属化学、材料化学和药物化学等领域有诸多的应用。而
传统的寿命试验模型中通常假定产品失效的机理只有一种,但在实际中,产品的失效机理可能存在很多种,且任何一种失效机理均可以导致产品失效,这就是竞争失效。带有竞争风险的产
在生物医学、社会学、经济学以及教育心理学等领域常常遇见大量的缺失数据。在已有的研究成果中,大多都是在可忽略缺失数据机制的条件下进行讨论的。然而,在很多实际应用中,
目的:T细胞免疫球蛋白和黏蛋白结构域-3(T-cell immunoglobulin and mucin-domain containing-3,TIM-3)与程序性死亡受体 1(programmed cell death 1,PD-1)和肿瘤浸润性淋巴
目前,我国经济社会发展已经进入一个新时代,城市人口总量的发展逐渐由人口迁移流动代替人口自然变动,人口迁移流动等因素也对城市经济、社会发展产生了较为显著的影响。在人