基于本体的疾病分子标志物挖掘方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a273582760
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物医学数据的不断增长,人类对疾病的认识不断加深。在疾病相关标志物的研究中,疾病相似程度的量化以及疾病相关标志物的识别对解释疾病的致病机理和预后有着很重要的意义。由于疾病相关数据具有多样性和异构性,如何利用计算机方法高效地对疾病分子标志物进行分析及挖掘充满着挑战。本文针对疾病相关的分子标志物挖掘进行了深入的讨论和研究。主要工作内容包括以下四个方面。(1)研究了基于功能网络融合的疾病相似度计算方法。利用基因的功能关联来量化相关疾病的相似程度是计算疾病相似度的常用方法。但是在基因的功能关联网络中,目标基因不仅与相邻基因之间存在直接关联,而且与非邻基因有着间接联系。疾病相关基因之间的联系通常考虑的是基因的直接关联,忽略了间接联系。同时,相对于融合多种功能关联网络,单一的功能关联网络存在数据量和构建方法上的局限性。因此,本文提出一个基于基因功能关联网络融合的疾病相似度算法。首先,利用疾病本体术语对疾病相关基因进行注释;然后利用全局优化算法对多种基因功能关联网络中基因之间的权重进行重新计算;最后,根据疾病相关的基因注释信息以及疾病本体语义结构计算得出疾病之间的综合相似度。实验结果表明,相较于现有方法,基于功能网络融合的疾病相似度算法可以进一步提高计算的准确度。(2)研究了基于疾病以及文献关联的相关代谢物预测方法。目前,通过生物化学实验发现了大量的疾病与代谢物之间的关联。但是相比于疾病或代谢物的总量,疾病与代谢物之间的关联数量相对稀少。因此,在对疾病相关代谢物进行预测时容易出现数据稀疏问题,从而无法准确地预测疾病与代谢物之间的潜在关联。本文首先利用医学主题词以及疾病本体的疾病术语构建疾病词汇表,并利用疾病词汇表建立疾病术语与代谢物之间的映射关系;然后,结合疾病之间的相似度以及代谢物相关文献的关联度计算代谢物的综合关联,并建立关联网络;最后,基于混合推荐模型对代谢物与疾病之间的潜在关联进行预测。本文采用基于数据增量的验证方法选取了19种疾病对该方法进行验证,实验结果表明该疾病相关代谢物预测模型有较好的泛化能力。(3)研究了基于多种生物数据源的疾病与非编码RNA关联预测方法。在研究疾病与非编码RNA之间的关联关系时,疾病相似度常作为非编码RNA的特征关联用于非编码RNA关联度的计算。但非编码RNA的特征信息不仅仅是疾病,还包括其他信息。因此,综合利用与潜在标志物相关的多种特征可以更加准确地量化关联程度。为了跨数据源对疾病相关非编码RNA进行研究,本文首先对非编码RNA进行统一命名。根据数据源的不同特点,分别对长非编码RNA和环状RNA的相似度进行定义,并结合疾病与长非编码RNA以及环状RNA之间的映射关系构建由疾病与非编码RNA组成的多层网络。最后,基于多层网路的拓扑结构对疾病相关的非编码RNA进行预测。(4)研究了基于知识图谱的疾病潜在标志物预测方法。疾病相关的知识图谱中的疾病知识往往只包含某一种疾病特征。虽然可以对疾病相关特征有针对性地研究,但疾病特征的单一降低了对疾病实体的描述能力。本文对疾病相关数据集进行整理和收集。然后,通过对疾病关联信息的抽取、术语标注、知识合并,集成疾病相关实体之间的关系并构建疾病的知识图谱。通过对知识图谱中疾病相关信息的特征分析,基于图嵌入技术对疾病以及相关标志物节点进行潜在表征学习,并对疾病与潜在标志物关联进行预测。最后,实现疾病相关知识的关联挖掘可视化注释,有效支持人类疾病机理的深入理解。
其他文献
尾缘噪声是翼型自噪声的主要来源,中低雷诺数层流下刚性翼型尾缘易产生高幅值单音噪声,破坏空中、水下航行器的安静性。翼型可变形设计为降低航行器噪声和提高航行器经济性提供了新的途径,具有广阔的应用前景。弹性尾缘是可变形翼型的一种基本形式,结构相对简单。然而,目前对翼型弹性尾缘噪声的产生机制和声学特性的研究十分有限,对不同弹性尾缘形式、结构参数下辐射噪声的变化规律研究亦较少。针对以上问题,本文以NACA0
近年来随着超精密加工制造及精密计量等领域的快速发展,位移测量精度需求逐渐由纳米量级向亚纳米甚至皮米量级过渡。非共光路外差干涉光路由于解决了传统共光路外差干涉光路中几纳米至十几纳米的周期非线性误差,已然成为下一代干涉仪的发展方向。然而,非共光路干涉结构的光路更复杂且光程更长,这导致其比传统共光路干涉结构更容易受到温度的影响,此时镜组热漂移误差则凸显出来,成为制约非共光路外差干涉仪进一步提高测量精度的
城市化进程的快速发展带来了人口数量增加与土地资源短缺矛盾,也促使建筑寻求向高空发展,超高层建筑高度不断刷新,可预期的千米级摩天大楼在策划和憧憬。目前,千米级摩天大楼的许多研究领域仍处于探索阶段,有必要开展深入研究,为千米级摩天大楼的建造提供技术支撑。本论文重点关注千米级摩天大楼暖通空调系统设计建造中的室外设计参数选取、能源系统设计策略、系统分区模块式设计方法、烟囱效应的应对策略等方面问题,以期为千
湍流边界层广泛存在于日常生活和工业生产中,如商用客机、高铁和管道运输等。在这些应用中,湍流边界层中的壁面摩擦阻力是造成能量消耗的主要原因之一。例如,商用客机在正常巡航时,湍流边界层中的壁面摩擦阻力占其总阻力的一半以上。降低湍流边界层中的壁面摩擦阻力不仅能够带来巨大的经济效益,还能有效地减少化石燃料燃烧导致的温室气体排放,从而有利于保护环境。因此,研究湍流边界层减阻技术在工程中具有重要意义。在湍流边
语音情感识别在人机交互领域具有广泛的应用场景,例如呼叫中心、移动服务等。在实际应用中,语音情感的复杂性,不仅使得需要采用高维的特征来对每个状态进行刻画,而且也令数据标注的代价高昂且费时。因此,学习具有判别性的低维语音情感特征表示,就成为语音情感识别研究的关注焦点之一。半监督语音情感特征学习作为一种主流的方法,其大体可分为两类:一是对单一来源的数据,通过利用分布一致的大量无标注数据与少量标注数据进行
随着近年来机器人应用领域的飞速拓展,通过观察人类示教过程自动掌握新任务的方法成为机器人领域的又一个研究热点。总体而言,该领域主要涉及示教信息获取和机器人任务学习两个方面的内容。伴随机器人技术的不断革新,示教信息的获取方法从传统的基于离线编程和示教盒的方式转变为后来的拖动示教方式,进而又发展为现阶段的基于视觉观察的示教方式。示教任务中操作物体的检测与位姿估计是视觉观察的核心内容。不同于一般视觉感知任
作为典型的微结构光学元件,菲涅尔微结构光学元件具有体积小、重量轻、结构紧凑的优点,在太阳能、投影显示、摄影、照明光学、激光、红外探测和太赫兹天线等领域被广泛应用。目前正在发展以玻璃模压为代表的复制加工技术以实现其大批量低成本生产,其关键技术是硬脆菲涅尔微结构模芯高效高精度制造。由于菲涅尔微结构的非连续特殊表面轮廓,采用超精密磨削来加工时会发生快速且严重的砂轮磨损,限制了加工精度和效率的进一步提升。
实际控制系统往往伴随着系统参数摄动和扰动甚至是故障,而网络化控制系统更加面临着时滞、丢包以及匿名攻击等不确定性因素。由于这些复杂不确定会影响甚至损害动态系统的稳定性和性能,因此,研究复杂不确定动态系统的估计和控制问题,一方面可以提供动态系统的估计进而实现控制,另一方面可以为实际控制系统运行的鲁棒性、容错性、可靠性以及安全性提供技术支撑。本论文针对若干类典型的动态系统,考虑其中常见的不确定性,例如物
故事是儿童认识世界的门户,它对孩子的魅力是无穷的。故事生动活泼、浅显易懂,学好故事类课文对于培养学生对语文的兴趣,提高语文素养具有重大的意义。在引导学生创作故事时,要基于故事的文体特点,将听说读写等各方面的知识点、语言训练点都融入其中,引导学生一步步把握故事模型。有了故事模型的支撑,学生会感受到创作故事也是有章可循的,他们的想象能力、创作能力会大大提升。
随着中国饮食模式的西方化及久坐等不良生活方式的加剧,非酒精性脂肪肝病(Nonalcoholic fatty liver disease,NAFLD)的发病率逐年上升,已成为危害人群健康的重要公共卫生问题之一。目前没有特效药用于治疗NAFLD,调整饮食生活方式被认为是治疗NAFLD的首选方法。莱菔硫烷(Sulforaphane,SFN)是一种异硫氰酸酯类植物化学物,含有亲电子活性基团-N=C=S,使