基于拉普拉斯正则化稀疏匹配模型的组学数据关联关系发现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:qqqqq721106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物信息技术的发展,高通量测序技术的出现极大地降低了测序的成本,提高了测序的性能,使得高效全面地测定同一样本不同层面的组学数据成为可能。目前已积累的海量多源异构生物医学数据奠定了整合分析多组学数据的基础,为揭示肿瘤发生发展的机理提供了的前所未有的机遇。但是由于数据中的噪声成分较大以及个体之间的差异性等因素,如何高效准确地识别多组学数据间的关联关系仍然是一个有待解决的问题。虽然现有模型在组学数据关联关系分析中取得了不错的进展,但仍存在一些不足之处。例如,大部分研究都仅仅聚焦于组学数据本身的分析,很少考虑在模型中加入其他重要的先验信息,甚至完全没有利用任何先验信息,但一些研究表明对先验信息的合理利用不仅可以提高模型准确性和健壮性,还可以提高运算效率。另外,越来越多生物分子之间的潜在关联已被证实,如基因调控网络、蛋白质-蛋白质相互作用网络和代谢路径网络等等。基于此,本文的主要内容如下:首先,本文简要地阐明了组学数据关联关系发现的研究背景、现状和意义。其次,本文简单地介绍了组学数据的获取方法与预处理方式。随后,本文对拉普拉斯矩阵的特性作简要的介绍。进一步地,本文基于组学数据关联关系的特点,为多组学数据关联关系的发现提出了拉普拉斯正则化稀疏匹配模型LRSM,该模型通过拉普拉斯正则项结合已有的先验信息对组学数据进行分析,挖掘数据中的潜在关联关系。此外,模型引入了L0-范数来对结果的稀疏性进行约束,最终可转化为带不等式约束的二次凸优化问题,并采用增广拉格朗日乘子法结合随机梯度下降法进行高效求解。最后,我们在模拟数据集和真实数据集上对拉普拉斯稀疏匹配模型进行测试,通过与现有方法进行比较分析证明了模型的有效性与可靠性。综上所述,本文的主要意义在于:(1)通过在模型中加入拉普拉斯正则项引入先验信息,以期减少噪声对结果的影响,降低数据误差所带来的不确定性,并且提高结果的准确性与鲁棒性。(2)通过模拟实验探究拉普拉斯正则项对模型的影响,说明了先验信息在多组学数据关联关系发现中的重要作用。(3)除了理论上的分析,我们还对结果进行了较为充分的生物学验证,结果表明了模型的有效性和合理性,说明其对加深理解癌症发生发展过程中在各个组学层面上的变化规律具有一定的积极意义。
其他文献
含吲哚骨架的杂环化合物作为一种非常重要的化合物,在自然界中具有广泛的分布。其天然产物具有良好的生物、药理活性,在有机合成领域有着重要的应用前景与应用价值。近年来,
本论文选用稀土离子、铜离子、锌离子和镉离子为中心金属,1,3-金刚烷二羧酸(1,3-H2adc)和3,5-二(3,4-二羧基苯氧基)苯甲酸(H5L)为主配体,2,2’-联吡啶(2,2’-bpy)、4,4’-联吡啶(4,4’
随着经济和客户服务的发展,智能问答系统出现在大众视野,该系统的主要功能是接收和处理用户的问题然后快速精确地匹配问题答案并返回给用户。其中,文本匹配是智能问答系统的关键技术,传统的匹配方法需要大量的人工手段来匹配文本,匹配的准确率有待提高。随着深度学习技术的发展,其在自然语言处理领域取得了很大成就,同时也面临很多挑战。针对目前深度学习方法在文本向量表示时较单一,并且对现有交互型和表示型模型没有充分融
随着科技的进步,人们对人工智能、大数据、云计算和物联网等新兴学科的关注度越来越高。这些学科的发展都是通过对于大量目标数据进行采集存储,再通过相关算法对这些数据进行
塔里木河干流是南疆生态环境的生命线,是塔克拉玛干沙漠的一块生态屏障,但由于气候变化、自然资源的不合理利用等因素使其生态服务功能大大减弱。为了分析研究塔里木河干流水土资源变化及其生态恢复,本文以塔里木河干流沿岸的土壤、植被为研究对象,采用统计学的方法对塔里木河干流不同胡杨下土壤水盐的特征进行了分析;从胡杨的径级结构、静态生命表、分布格局3个方面分析了胡杨(Populus euphratica)种群的
油气管道运输作为我国五大运输产业之一,对我国国民经济的发展起到了非常重要的作用,被称为国家的“能源血脉”。随着我国经济的发展,对油气能源的需求量日益增大,输送管道的
本文以寒冷地区海洋环境下的混凝土桥梁为研究对象,基于已有混凝土结构遭受冻融损伤和钢筋锈蚀的退化模型及试验研究成果,针对寒冷地区海洋环境混凝土桥梁的抗震性能展开研究,主要内容如下:(1)通过已有混凝土结构遭受冻融损伤和钢筋锈蚀的退化模型及试验理论研究的归纳分析,确定适合于本文分析的混凝土结构遭受冻融损伤和钢筋锈蚀后的退化模型。(2)通过对混凝土桥梁抗震理论研究成果的归纳分析,确定适用于退化混凝土桥梁
荧光探针技术是一种通过改变荧光信号将分子识别信息的变化表示出来的检测方法。因其具有专一的选择性,良好的灵敏度,操作简便等超越其他传统检测技术的优势,成为备受科研工
合理优化资源配置提升公交运营效率是当前公共交通优化过程中迫切需要解决的理论与实践性问题。通过对于公交组合调度模式的探究,可以有效增强公交吸引力、提升乘客满意度和公交分担率,优先发展公共交通具有重要。本文深入分析我国公交运营模式、供需资源约束及现有调度模式存在的问题。依据国内外研究成果,分析公交客流需求特性,结合现有公交资源配置,对全程车和大站快车组合调度优化模式进行分析探究。针对现状问题提出相应的
在我国发展的新时代下,中国制造2025计划,是中国政府实施制造强国战略的第一个行动纲领,其十大重点工程之一就是机器人技术。而机器视觉控制系统则将成为现今高端制造装备的“大脑”。基于机器视觉技术,设计了适用于常规工业机器人的视觉识别定位及引导功能系统。其中着重对保留边缘的分灰度级平滑滤波技术、特征描述子的建立以及手眼的快速标定进行着重研究,并利用实验室六轴机器人平台,通过具体实验进行系统功能性测试。