eQTL数据处理与功能分析方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:haierv70
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因组测序技术的快速发展以及测序成本的下降,大型人群基因组计划不断开展,基因组变异的发现数量得以空前增长。如何有效挖掘和认识基因组变异的分子功能,是功能基因组时代迫切需要解决的重要问题,对理解和研究疾病等重要性状的分子机理、发现药物靶点等具有重要意义。表达数量性状位点(expression Quantitative Trait Loci,eQTL)分析是解决该问题的重要途径,其通过在大量样本中分析基因组变异类型与基因表达强度之间的关系,可以从全基因组尺度挖掘基因组变异对基因的功能影响。然而,eQTL数据具有高噪声、数据不完整性、蕴涵复杂生物功能关系等特点,现有eQTL数据分析方法难以有效挖掘和揭示其中蕴涵的重要生物功能,迫切需要建立更加有效的数据处理与功能分析方法。本文围绕eQTL数据处理与功能分析方法开展研究,主要内容包括以下几个方面:第一,针对eQTL原始数据具有的多源异构性、普遍存在异常样本、普遍存在混淆因素带来的高噪声等问题,本文整合多种统计特征与模型,构建了一套涵盖数据质量分析、异常数据检测、混淆因素校正和数据归一化的eQTL原始数据清洗方法,解决了多源异构eQTL原始数据质量控制与归一化问题,有效降低人工干预、降低数据噪声、提高数据质量。第二,针对eQTL总结数据普遍存在缺失统计量的问题,本文提出基于多变量高斯分布的缺失eQTL数据推断方法。该方法基于变异之间的连锁不平衡关系,通过使用多变量高斯分布对eQTL统计量进行建模,用已知eQTL统计量对缺失eQTL统计量进行推断。通过全基因组片段化处理以及构建动态连锁不平衡关系矩阵,使该方法适用于并行分析,并有效提高缺失数据推断效率。该方法不需要原始基因型数据和原始基因表达数据,并适应于多种类型的QTL缺失数据推断。同时,该方法可以突破原始eQTL分析次要等位基因频率底线阈值,能够有效提高eQTL研究信号发现量。该方法有利于提高eQTL总结数据完整性、进一步增强eQTL研究的生物学发现。第三,针对eQTL与多基因间调控模式挖掘问题,本文提出eQTL调控网络构建与模体挖掘方法。该方法通过自适应置换检验策略以及基于广义帕累托分布拟合eQTL中介效应零分布,快速、高精度地计算eQTL中介效应,并整合eQTL二部网络与基于互信息的基因调控网络,构建eQTL调控网络。在此基础上,本文通过基于启发式子图同构判别的eQTL调控网络模体挖掘方法,降低子图同构判别计算空间,提高网络模体挖掘计算效率,挖掘eQTL与多基因间调控模式。该方法拓宽了传统基因调控模式研究思路,为eQTL与基因间的调控功能研究提供了新的方法支撑。第四,针对整合多组学数据进行生物分子网络中疾病模块挖掘问题,本文提出整合eQTL网络和多组学数据的疾病功能模块挖掘方法。该方法首先以eQTL网络作为桥梁,融合疾病表型与基因组变异关联数据(GWAS)、转录组基因表达与基因组变异关联数据(eQTL)、以及蛋白质相互作用数据(PPI),构建融合多组学数据信息的复杂生物分子网络。在此基础上,利用图表征学习模型对网络进行特征提取,利用层次聚类方法进行无偏向性的功能模块挖掘,利用疾病相关基因在模块中的富集水平对功能模块进行优先排序等,实现疾病功能模块挖掘。该方法有助于从系统生物学角度研究疾病分子通路,以及eQTL在疾病分子通路中的功能影响。
其他文献
当前,航空航天飞行器结构正面向大型化、轻量化、高收纳和高承载的趋势发展。空间充气展开结构由于其轻质、折叠体积小和展开可靠性高等优点成为上述问题的潜在解决方案。但空间充气展开结构存在的皱曲、形状保持困难和承载能力低等问题成为制约其发展的主要因素,已有的研究中采用网格增强薄膜来提升薄膜充气结构的形状稳定性和承载能力,其中网格类型包括柔性网格和刚性网格。柔性网格增强薄膜结构目前基本仅限于工程应用,缺乏网
东北严寒城市受到极端气候制约,城市冬季环境视觉效果单一乏味、景观的冬季特征不明显、景观系统脆弱不可持续、居民冬季活动受限。这也或多或少地导致了东北严寒城市经济相对落后,城市冬季活力不足,城市文化不突出等城市问题,这些城市的综合问题与城市公共空间景观有着密切的连带关系。本文以东北严寒城市公共空间冬季景观为研究主体,以改善冬季景观的品质为目标,研究冬季景观的活力性。以期改善东北严寒城市的冬季景观,以景
烘焙食品在人们的日常饮食中占据重要的位置,是许多国家日常消费的主食。小麦粉蛋白独特的结构引发面团具有高度结构化的网络,赋予烘焙食品具有高粘弹性,高持气量和特殊的感官质量,小麦粉广泛用于烘焙食品中。非洲地区不产小麦,主要是靠进口,非洲热带和撒哈拉以南地区木薯(Manihot esculenta Crantz)产量非常大,是非洲地区的主要粮食作物,木薯粉是非洲的主要主食。木薯粉淀粉含量较高,其增稠能力
会计文化包含在行业实践中所形成的精神、意识形态、物质文化、制度特征以及相关的规章制度和行业措施经验,文章对会计文化研究的热点、方向进行研究,讨论会计文化的发展趋势,为会计行业从业人员提供科学参考。研究结果表明,文献计量统计分析围绕会计文化的科学研究形成了一个以关键词"会计文化"为中心的知识网络,知识图谱具有中心化特征,会计文化研究领域具有上升期的特点;在会计文化研究中增加案例研究、量化研究、前瞻性
期刊
网状聚氨酯泡沫在众多领域中用途广泛,发展前景十分广阔。该材料通常由闭孔聚氨酯泡沫经爆燃网化处理制备而来。目前,爆燃网化工艺中生产参数的确定与控制缺乏理论指导。本文围绕聚氨酯泡沫爆燃网化工艺破膜与熔膜过程中的科学问题,对薄膜材料在均布载荷下的力学响应及极限载荷分析、柔性多孔障碍中爆燃火焰的传播特性以及材料的熔膜特性三方面进行了研究。破膜过程是采用气压差实现聚氨酯泡沫窗膜破裂的过程,有助于可燃气体的充
液态金属是一种室温下呈液态的金属,兼备金属和流体特性,具有良好的导电性、导热性和流动性。凭借其独特的理化特性,液态金属在高功率电子器件、高热流芯片冷却等热管理中得到广泛应用,近年来液态金属还成功应用在柔性电子器件、智能驱动器、电化学传感器和微机电系统等领域。具有独立三维对称结构的液态金属微球在周期性先进功能器件中备受关注,然而由于液态金属的高表面张力和大密度等特性,如何制备具有高单分散性的液态金属
20世纪六七十年代,美国劳伦斯实验室在统计了大量精密测量/加工相关项目后得出结论:在精密测量与加工领域,热污染是最大的单一误差来源。国内相关研究也表明:在超精密加工过程中,热污染导致的误差占总加工误差的40%~70%。因此,热污染控制技术成为超精密测量仪器与制造装备保障精度的核心关键技术。循环冷却技术由于可将设备内的热量高效地“搬运”至设备以外,且可兼顾高控温精度、大功率与动态性能,因此在先进光刻
疲劳耐久性试验是车辆行业中评价整车以及零部件可靠性的至关重要的一个环节。电液伺服道路模拟器作为疲劳耐久性试验重要的设备,在室内提供一种与车辆实际行驶近似的振动环境复现车辆所受的载荷,不仅能够提高测试质量而且会降低试验成本、缩短研发周期。本文以哈尔滨工业大学电液伺服仿真及试验系统研究所为中国汽车技术研究中心预研的“轴耦合道路模拟器”项目为背景,重点研究基于6-RSS并联机构的轴耦合道路模拟器结构优化
钢管约束钢筋混凝土柱具有承载力高、延性好、抗震性能优良、与钢筋混凝土梁施工方便等优势,在高层建筑及大跨场馆中得到了较多应用,但目前尚无针对方、矩形钢管约束钢筋混凝土柱火灾下力学性能的研究。进一步地,火灾下框架柱不可避免地受到相邻梁、柱及节点的约束作用,其受火性能与约束作用呈强耦合性,与两端铰接柱差异很大。基于上述问题,本文采用试验研究、有限元模拟和理论分析相结合的方法,开展两端铰接、带有端部轴向和
极端环境交流永磁电机是深空、深海和深地装备的关键核心部件,其工作在大范围温度与压强变化的极端环境中。极端环境使电机材料特性发生变化,电机内物理场复杂、耦合严重、非线性问题突出,电机的特性和输出能力发生明显变化。然而,由于关键问题缺乏系统深入的研究,导致极端环境电机的设计、分析和应用缺乏理论和技术支持,严重制约了极端环境电机技术的发展。本文对极端环境电机材料特性获取、综合物理场计算、特性分析和参数设