吸纳通路信息识别相关基因的特征选择算法的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:lingshao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文中,我们重点阐述了我们所提出的在变量选择过程中借鉴了生物通路信息的这类特征选择算法。这些算法有着不同的用途,如对不同组别的样本进行分类或对不同病理亚型的癌症患者预测其死亡的风险。首先,我们对significance analysis of microarray-gene set reduction(SAMGSR)算法进行了扩展,使其能够吸纳和融合两种的通路知识。虽然SAMGSR算法本身属于一种基于通路的特征选择算法,但是SAMGSR算法只考虑基因的组别信息而忽略了基因间如何相互关联。这里,我们提出了一个SAMGSR算法的加权版本,即加权SAMGSR算法。此算法根据基因间的交互作用构建权重,然后综合基因的权重和检验统计量来选择相关基因。使用模拟和真实世界数据,我们对所提出的SAMGSR扩展算法的性能进行了评估。这些分析表明SAMGSR加权版本确实优于原来的版本,因此添加的基因交互作用信息有助于相关基因的选择。而后,我们介绍了另一种加权的方式,即直接将权重同基因表达值相结合生成加权基因表达值。我们使用这些加权基因表达值和LASSO算法进行了相关基因的选择。这种加权方式不同于加权SAMGSR算法中采用的加权方式,其不但成功地引入了通路信息,而且使很多传统的特征选择算法的再次利用成为可能,节省了提出全新算法所消耗的时间。使用模拟和真实世界的数据,我们已经证明使用通路信息,加权基因表达谱通常优于原始的基因表达谱。Cox-filter的算法是为数不多的可以验证是否存在着特定于非小细胞肺癌各亚型的预后基因的一种特征选择算法,其在特征选择过程中没有考虑任何通路信息。此算法以患者生存时间为因变量对每个基因拟合一个Cox模型来检验基因,疾病亚型,和两者交互作用项与生存时间的相关程度。在本文中,我们使用符号平均值(sign average)方法生成了代表整个基因集表达水平的伪假基因,然后依次在通路水平和基因水平上拟合Cox模型,来进一步扩展了 Cox-filter算法,使其能够不仅吸纳了通路信息,还能够选择特定于亚组的预后基因和预后通路。采用不同的对通路选择和对基因选择的顺序,我们提出了两个算法,它们被命名为正向Cox-filter算法和反向Cox-filter算法。使用模拟和非小细胞肺癌的基因表达数据,我们证明了正向Cox-filter算法在预测能力和模型稳定性方面均优于反向Cox-filter算法和其他相关算法。正向Cox-filter算法和反向Cox-filter算法容易理解、便于操作。因此对有兴趣探索基因表达数据预后价值的研究人员来说,它们将是十分有用的统计方法。
其他文献
本文旨在研究耦合对流扩散方程组Cauchy问题解的渐近行为,并讨论问题非平凡解的整体存在性与爆破性质,建立Fujita型定理.本文主要分为四部分.在第一部分中,我们研究了一类通过源项耦合同时具对流项的扩散方程组的Cauchy问题.在大初值情形下,利用能量估计的方法证明了非平凡解在有限时刻爆破.根据扩散方程的经典理论.我们通过一系列精确的计算构造出问题的辅助上解并证明了小初值时,方程组的非平凡解是整
MgO势垒磁性隧道结是自旋电子学的核心元器件之一,因其在室温下巨大的磁电阻效应得以应用于硬盘磁读头、磁随机存储器及磁传感器等器件,极大地促进了自旋电子学的发展。基于它的隧穿磁电阻传感器由于其高灵敏度、低噪声、低功耗等优势在汽车电子、工业测量、电子罗盘及生物检测方面均有非常好的应用前景。如何进一步提高传感器的灵敏度并降低噪声,是实现微弱磁场检测的关键。为此,我们对MgO势垒磁性隧道结传感器进行了较为
报纸
本文首先引入了矩阵的幂零性多项式,刻画了具有二次齐次幂零性多项式的矩阵,作为应用,给出了这些矩阵是Druzkowski矩阵的充分必要条件.然后利用线性群的作用,给出了子空间可三角化的条件.最后,给出了判断二元多项式环的非单自同态是否有非平凡固定元的一种构造性方法.本文研究的问题来源于仿射代数几何领域的几个公开问题:雅可比猜想,Tame生成子问题,Zariski 消去问题.雅可比猜想已经被化简到Dr
随着激光技术的不断发展,超短超强激光脉冲驱动原子或分子会产生许多新的物理现象,如多光子电离,阈上电离,序列双电离,非序列双电离,高次谐波发射,阿秒脉冲产生等等,这些现象无论是从理论研究还是从实际应用角度都获得了人们广泛的关注。其中,非序列双电离过程中由于电子与电子之间具有高度的关联性,因此研究非序列双电离成为复杂课题之一。非序列双电离反映了原子分子物理中既基本又复杂的电子动力学过程,它吸引了研究人
在本篇论文中,我们研究了热背景温度下,星团中光致蒸发盘的形成和演化。模型从星前云核引力坍缩开始。理论研究表明,当盘能够扩散至几十AU时,外光蒸发变得重要。由于在盘演化期间,分子云核初始角动量决定了盘的尺寸,因此当研究光致蒸发盘的演化时,应当考虑核的性质。我们证明在热的温度环境下,外光蒸发被抑制,盘的性质由核的性质(例如Tcd和ω)决定。在星团的温区中(Tcd=40K),即便ω非常高(ω=13×10
算子逼近和算子数值域的研究一直是算子理论与算子代数中一个非常重要的研究领域.人们习惯利用算子的谱的信息来研究算子的逼近问题,尝试从其他方面和角度来逼近算子,在算子逼近理论中是一个值得尝试的思路.在本文中,我们将数值域的研究工作与算子的逼近理论结合起来,从算子数值域的角度来研究算子的逼近问题.有限维空间上算子的数值域都是一个闭集,而复无穷维Hilbert空间上算子的数值域并不一定是闭集.在2003年
没有民主就没有社会主义,就没有社会主义的现代化,就没有中华民族伟大复兴。中国共产党在百年奋斗中,团结带领人民探索、形成、发展了全过程人民民主。党的十九届六中全会《决议》强调“发展全过程人民民主,保证人民当家作主”。全过程人民民主把人民当家作主具体地、现实地体现在党治国理政的政策措施上,具体地、现实地体现在党和国家机关各个方面、各个层级工作上,具体地、现实地体现在实现人民对美好生活向往的工作上
期刊
膜性肾病(membranous nephropathy,MN)是指免疫复合物沉积于肾小球基底膜上皮细胞下并导致基底膜增厚的一类肾小球疾病[1],临床主要表现为蛋白尿或肾病综合征,或伴有镜下血尿。按发病原因分为特发性和继发性,无明确病因者称为特发性膜性肾病(idiopathic membranous nephropathy,IMN)。西医治疗多采用激素联合免疫抑制剂,但存在免疫力差、感染、肝肾
本文以断层泥中粘土矿物为研究对象,通过野外样品分析获得了粘土矿物在断层带内的分布特征,并利用传统粘土矿物地质温度计推测断层活动所致温度小幅升高的数值;同时,结合室内高温高压水热实验和理论计算,为更清晰厘定粘土矿物转化过程中的影响因素,如温度压力、层间有机质、流体组分浓度等对粘土矿物转化的影响,探讨断层发生时复杂野外地球化学条件下,如何使传统粘土矿物地质温度计更精确且广泛应用于推测断层活动所致温度小