基于网络分析的高维组学数据模块化特征匹配方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:kingzdh410
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在药物发现、药物重定位和癌症治疗领域,精确识别基因组学数据和药物之间的关系具有十分重要的意义。多个研究显示,基因和药物之间的关系呈现“多对多”的共表达模块现象,而不是“一对一”的情况。这种共表达模块能够较为充分地展示复杂生物调控机制和药物之间的关联关系。然而,从海量数据中有效地发掘潜在的共表达模块的方法目前还有待完善。因此,本文对现有的研究算法进行综述总结,并且提出了一种新的基于网络分析的高维组学数据模块化特征匹配模型。本文首先介绍了共表达模块识别的研究意义和应用价值。之后,从机器学习角度提供了对于基于非负矩阵分解、偏最小二乘法和网络分析这三类前沿的共表达模块识别方法的详细评估。随后,针对这些方法存在的不足之处,本文提出了一种新的基于网络分析的高维组学数据模块化特征匹配模型并给出模型的求解方案。模型使用高阶张量相似度信息、超图先验知识网络约束和稀疏约束联合优化获取共表达模块。最后,实验结果和分析利用模拟实验和真实实验展开。通过在噪声污染和无关样本干扰两组模拟实验的对比,证明了本文提出的模型在这两种场景下都具有良好的性质。真实实验使用了在392种细胞系上的2091种基因表达数据和101种药物反应数据。通过和多个前沿的方法进行生物验证对比后,证明之后本文提出的方法拥有良好的性质,输出的结果具有生物学意义。本文提出模型的主要贡献在于:1)使用高阶张量相似度信息,这种反映多对多关系的张量削弱了输入数据中噪声和无关样本的干扰。2)将共表达模块的获取融入目标函数的迭代优化中,解决了目前方法解耦策略的缺陷。3)使用超图融合多个先验知识网络信息,这相比于单种先验知识网络提高了先验知识约束的效果。
其他文献
基于P300的脑机接口(BCI)字符拼写器使用户可以仅通过视觉刺激诱发大脑响应来拼写字符,从而在脑和计算机之间建立直接的通信渠道。从脑电图(EEG)中检测和分析P300信号对于搭建这个BCI拼写系统具有重要意义。卷积神经网络(CNN)相较于传统的机器学习方法已经展示出了更好的P300检测性能。由于P300数据集一般较小,为了在有限的模型复杂度下达到更高的识别精度,根据P300信号的特点,本文分别在
行人检测是目标检测的重要话题,有着广泛的应用场景,如视频监控、自动驾驶、智能机器人等。近年来基于深度卷积神经网络的通用目标检测器取得了巨大的成功,多数行人检测方法沿用了通用目标检测方法中的检测模式,使用边界框表示目标并作为回归目标。然而车载场景图像数据中行人尺度、姿态变化和遮挡等因素都对现有行人检测器带来一定挑战。本文分析了现有行人检测器存在的主要问题并提出相应改进措施,遵循相同检测模式,分别设计
诺如病毒(Norovirus,NoV)是引起非细菌性胃肠炎的重要病原。由于一直缺乏完善的细胞培养系统与小动物感染模型,极大地限制了疫苗和抗病毒药物的研究。NoV有丰富的遗传多样性,但不同型别毒株间难以形成免疫交叉保护效果。因此,解析不同基因型间免疫交叉的分子机制将为病毒疫苗设计提供重要理论支持。在过去几十年里,GⅡ.4型一直是造成暴发的主要流行基因型,然而在2014/2015年冬天,GⅡ.17 K
建筑运行能耗占我国能源消耗总量的30%以上,是我国如期实现碳达峰、碳中和目标的重要组成部分。办公建筑能源使用强度为住宅建筑的10~20倍,不当的控制策略或用能行为可导致大量的能耗浪费,甚至引发严重故障或事故。因此,如何开展建筑运行状态异常检测工作,建立实时故障报警及预警机制,对保障建筑运行过程的节能高效、安全稳定具有重要意义。机器学习技术可实现抽象数据的映射关系提取,有效克服数据海量等难点,尤其适
水葫芦作为一种具有很强繁殖能力的生物入侵物种,可以作为生物质能被加以利用。为克服生物质热解油含氧量较高、热值较低的特点,生物质热解研究朝着与其他富氢废弃物如废轮胎等混合共热解以提高热解油品质的方向发展。而为了进一步提高热解反应效率,通常会加入沸石催化剂参与热解过程。商用沸石催化剂如HZSM-5由于具有单一的微孔,使得催化剂在热解过程中容易因积碳堵塞而造成中毒失活。而孔径较大的介孔催化剂由于其酸性位
变压器在电力系统中具有电压等级变换、电能分配等重要作用。在变压器运输过程中受到撞击,或投入使用后出现过电流均可能导致绕组发生变形故障。变压器发生故障时,可能会降低电力系统的运行效率,甚至可能导致大面积的停电,造成严重人力物力损失。及时发现潜在的变压器绕组变形故障并进行检修有利于电力系统的稳定运行。对变压器绕组状态进行非侵入式检测目前有许多种方法。其中,频率响应分析法因其操作简单、对绕组轻微变形敏感
软黏土由于其低渗透性、低承载力和高含水率,不适合直接作为工程中的建设用地。目前,电渗排水法是降低细颗粒土体含水率的有效方法,然而这种电化学技术的效率仍需要进一步提高才可以更好的用于实践。纳米材料作为近几十年内涌现的最有前途材料之一,低掺量下就能够显著改善土体的物理力学性质。本文基于纳米材料的独特性质,将其用于黏土的加固中,并将纳米材料与电渗排水技术相结合,开展了系列室内电渗试验,探究纳米材料对电渗
悬架系统对车辆的动力学性能和安全性能起着很重要的作用。悬架系统的设计需要综合考虑诸如乘坐舒适性、悬架行程和制动驱动性能等多方面的特性。而空气悬架系统的独特优势正在于能够很好的满足悬架设计的各种要求,因此引起了国内外许多学者和工程人员的关注。本文开展对于空气悬架系统的核心部件,即空气弹簧系统的动静刚度特性的研究。针对单管空气弹簧系统存在的问题,从结构上的提出改进方案,即提出双管空气弹簧系统的来提升空
酚醛树脂胶黏剂以其突出的胶接性能广泛应用于木材加工等行业。但酚醛树脂胶黏剂合成原料之一的苯酚是一种化石工业的副产品,具有不可再生的缺点,并且苯酚有一定的毒性,大量使用会造成环境污染。因此,木质素这种天然可再生资源因其化学结构特性成为了替代部分苯酚制备酚醛树脂胶黏剂的重要原料。但由于木质素的结构比较复杂,并且其具有活性反应位点少和分子量分散性较高等缺点。因此,木质素在替代苯酚制备木质素基酚醛树脂胶黏
脑机接口(Brain-computer interface,BCI)是一种将传感器采集到的脑部信号解析成为脑神经活动信息的科学技术,该技术能够达到人脑控制外部设备或进行信息交互的目的,在人体机能康复和神经功能延展领域具有广泛的研究和应用价值。受脑信号的个体差异性和非平稳性影响,根据已有样本训练好的分类模型在预测其他受试者数据时难以保持准确性,并且采集受试者的脑信号数据往往时间花销大,因此在小样本数