半偏互信息在人类复杂疾病数据直接相关性模式中的应用

来源 :姜毅华 | 被引量 : 0次 | 上传用户:LJC21102309
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生命组学是对某一个类型的生物学对象的系统性和整体性研究。随着检测技术的发展和生物学研究成果的累积,各种组学研究都积累了大量的数据。对于复杂生物学问题的研究,例如癌症的发生发展机制和治疗方法等,合理地整合并使用各类组学数据,将会带来巨大帮助。在人类复杂疾病的研究中,通常会对患者体内各种类型生物分子的水平进行检测,以探寻能够反映疾病的生物分子特征模式。例如对癌症组织样本进行转录组学和蛋白质组学检测,或采集患者的血清进行代谢组学检测等。尽管样本类型和检测技术存在差异,但这些组学数据最后都可以表示为“样本*生物学变量”的数值矩阵形式,并且通常情况下生物学变量的个数远高于样本数。对于这类数据的分析通常分为两类,一类是水平变化的分析,另一类是生物学变量间的相关性分析。传统的生物学相关性分析多基于包括皮尔森相关系数在内的非直接相关性度量。近年来,随着算法与计算机科学的发展,直接相关性度量开始受到关注。半偏互信息是近年来引入的一种多元相关性统计量,用于考察在其它变量不变的情况下,一对变量间相互对对方不确定度的降低程度,是一种直接相关性度量。半偏互信息相对于常用的皮尔森相关系数,理论上具有更优越的性能。但半偏互信息在大规模的真实生物学数据中的表现如何还有待考察。此外,以半偏互信息为代表的直接相关性与以皮尔森相关系数为代表的非直接相关性相比,在反映生物学数据的相关性模式上有何不同,或者说直接相关性的“直接”,在生物复杂系统中对应什么,也是值得研究的问题。另外,由于半偏互信息的计算复杂度较高,难以直接整合到现有的成熟计算流程中,需要发展出新的计算方法。在本论文的研究工作中,我们选择了人类癌症mRNA转录组数据作为主要的生物学研究对象,以两种计算策略克服半偏互信息计算复杂度带来的问题,提取目标数据中的直接相关性模式,并与已有的生物学知识,尤其是组学知识进行比对。我们的结果显示,一方面,已知大致功能的较小基因集上,半偏互信息得到的直接相关性网络在一对基因间关系的水平上很好地反映了已知的生物学机制。另一方面,在完整基因组数据的计算中,半偏互信息相比皮尔森相关系数,表现出与各种影响基因表达的生物学机制具有更强关联的特性。这些生物学机制包括转录因子对目的基因的调控、一对基因受共同上游转录因子或microRNA的调控、一对基因的蛋白质之间存在相互作用、位于同一个染色体上的一对基因的转录起始位点更接近、特定的一对基因本体论(GeneOntology)分类、癌症中一对基因共同的拷贝数变化以及DNA甲基化模式。同时我们也发现,拷贝数变化突变在不同癌症亚型中可能具有不同的影响力和影响模式倾向。我们进一步将被半偏互信息直接相关性捕获的,具有癌症共拷贝数变化的基因对,应用在癌症患者的个体分类中,通过生存分析,发现了更多新的影响患者生存的突变因素。综上所述,我们将半偏互信息这一较新的相关性度量应用在复杂人类疾病的相关性模式分析中。通过结合各种组学数据进行比对,我们证明了半偏互信息与生物学机制存在特殊关联。因此,相比于以皮尔森相关系数为代表的非直接相关性度量,半偏互信息在生物学数据分析中具有更大的优势,可以获得能够反映生物系统中实际存在的变化的结果。
其他文献
广西驮英灌区位于广西三大旱片之一的左江旱片,历史降雨时空分布不均,旱涝灾害事件频发,极大地制约了当地的农业生产与经济发展。全面客观分析灌区旱涝演变规律,深入研究灌区水资源精细化配置是国家防汛抗旱应急减灾的重大战略需求,对灌区人民生活与生产意义重大。本文结合广西驮英灌区水资源配置特点,系统研究了灌区历史旱涝演变及趋势特征,构建了水资源优化配置模型,定量化分析计算了年际水资源精细化配置方案。具体研究内
无人驾驶碾压技术是降低人工劳动强度、提高作业效率、确保作业质量的重要技术手段。压路机在水电大坝建设中的典型作业场景是直线往复碾压一段条带后,横向移动到下一直线条带继续碾压。压路机性能波动和路面条件变化都会影响压路机的循迹精度,则碾压条带时就会产生漏碾。为了避免漏碾,相邻条带需要一定的重复碾压宽度(简称搭接距离)。为简化作业工艺,目前行业中多采用固定搭接距离方法,但面临的问题是:1)若搭接距离太小,
随着海洋油气资源开采逐渐走向深海,复杂恶劣的作业条件对海上平台提出了更高的要求。FPSO(浮式生产储卸装置)是一种多功能的海上浮式油气生产装置,集生产、储油和卸油于一体。FPSO上部模块复杂的结构和布置密集的设备,易出现油气泄漏爆炸事故,进而对人员、设备结构和环境带来重大损害。本文针对FPSO上部模块在开敞环境下,天然气的泄漏爆炸灾害进行风险评估研究,对实际工程具有一定的指导意义。构建了FPSO实
刀盘作为TBM的核心部件,在施工过程中直接与掌子面接触,因此会承受复杂的交变载荷和冲击载荷,随着载荷的反复加载,刀盘表面会因疲劳而萌生裂纹并逐渐扩展直至刀盘失效。本文在分析国内外相关研究的基础上,建立了基于Paris公式的刀盘裂纹扩展模型,利用XFEM实现了裂纹扩展模拟,并从静态裂纹和动态裂纹两方面验证了裂纹扩展模型的准确性。通过分析裂纹的扩展速率和路径,计算了单裂纹在服役载荷下的扩展寿命,总结了
随着大尺寸几何量计量技术的快速发展,长距离光电测距类仪器在生产生活中的应用更为广泛,对其量值溯源提出了日益迫切的需求。当前这类仪器的检定工作主要通过野外基线场开展,抗干扰性差、稳定性低、可重复性差、检测效率低,且国内大多数计量单位都缺乏野外基线检测的条件。因此,建立室内虚拟长度基线场很有必要。目前通常通过直角棱镜、角锥棱镜、光纤等器件建立室内基线场,针对现有方法中所存在的测量范围小、标定困难、无法
海洋平台一般为多层甲板结构,每层甲板均由骨架和甲板片焊接而成。每层甲板之间用管架连接起来。骨架承担着海洋平台受力时的主要载荷,属于海洋平台结构物中的关键部件。甲板的骨架为网格状,网格中交点处为十字形的是海洋结构大型节点,整个甲板层制造时,先制造出各个海洋结构大型节点,然后将这些节点按照设计图纸焊接成形拼接成一个整体。因此海洋结构大型节点的焊接制造是非常关键的一环,节点上的焊缝数量多并且长度大,焊接
随着深海油气开发的需求逐年提升,海洋立管的地位日渐凸显。海洋柔性立管是连接海上浮式平台和水下采油系统的重要构件,相比传统的钢悬链线立管,柔性立管具有可回收、质轻、易弯曲、易铺设等诸多优点。非粘结柔性立管是柔性立管中较为常见的一种形式,它常用于深海长距离的天然石油气运输。非粘结柔性立管自身结构复杂,由多种材料属性不同的金属层和聚合物层构成,且层与层之间不粘合可以发生相对滑移。在柔性立管的设计研发阶段
尽管近年来,语音识别技术在说话人无关的任务上取得了很大进步,语音识别的识别率也得到了显著的提升,但是由于训练过程中的数据与实际场景的数据不匹配导致说话人无关的语音识别系统的识别率依旧不如说话人相关的语音识别系统。说话人自适应技术尝试利用目标说话人少量数据将说话人无关的语音识别系统转为说话人相关的语音识别系统。在说话人自适应的过程中,一个主要的问题是数据的稀疏性问题。已有的说话人自适应技术没有从本质
煤矿大型机电设备多属低速、重载设备,且工作环境特别恶劣,零部件的异常磨损已经成为了此类机电设备常见的故障类型。如果不及时采取措施准确的掌握设备的摩擦磨损状态,一旦设备发生故障,将会严重影响生产效率,进而给企业带来巨大的经济损失。为了有效解决以上问题,本文将依据煤矿大型机电设备工作特点,基于油液检测分析技术对煤矿大型机电设备摩擦磨损状态检测分析技术进行深入研究,有效实现煤矿大型机电设备摩擦磨损状态检
公益事业单位是我国现代化建设中提供公共物品和公共服务的主要载体,为人民生活质量改善和现代社会进步推进贡献了巨大作用,本文的研究主体灯塔属于航标的一种,我国航标管理执行机构——航标处是交通运输部直属的公益事业单位,肩负着我国港口航道导助航标志配布、航标导助航效能维护、船舶安全航行保障等重要使命。灯塔作为公共物品,履行着公共服务职能,灯塔在漫长的历史进程和应用发展中,不仅为港口的发展和经济建设做出了巨