论文部分内容阅读
在人类基因组序列图绘制全面结束后,新的测序技术进入高速成长阶段,随之产生了海量的生物信息。面对浩如烟海的数据,从生物分子、环境因子、微生物等层面研究理解疾病致病原理以及疾病诊断、预后和治疗等具有重要的价值和意义。利用生物信息学方法发掘疾病关联因子是相关研究方向和内容的热点之一,备受研究者们广泛的关注和深入的研究。近年来,基于网络的疾病关联因子的预测模型和方法正研究备受关注,并取得了不错的预测效果。该类预测模型的基本思路是:首先,基于已知的关联关系构造网络模型,其次,使用该网络的部分或全部信息建立节点之间的关联,最后预测潜在的关联关系。其优点是利用相关生物数据和网络的拓扑特性预测疾病关联因子,具有一定的研究价值和意义,值得继续进行深入研究和分析。本文首先引入基于网络模型发掘疾病关联因子的一般内容,然后分别重点研究预测疾病关联LncRNA的问题和预测疾病关联微生物的问题,具体的研究内容简介如下:(1)预测疾病关联的LncRNA方面:首先,利用收集疾病相关的LncRNA信息构造一个二分网络。其次,基于假设—假若两个节点间有相同的邻接节点或者它们的邻接节点是相关的,则认为这两个节点间存在相似性—设计相似性测度分别计算疾病节点间的相关性与LncRNA节点间的相关性。最后,将计算得出的结果与已收集的疾病相关的LncRNA的信息相结合构造一个发掘潜在的疾病关联LncRNA的模型。通过实验可见,新构建的预测方法可靠有效。(2)预测疾病关联微生物方面:首先,分别将收集的疾病相关的微生物的信息和疾病相关的基因的信息转化为一个基于疾病与微生物的二分网络和一个基于疾病与基因的二分网络。其次,基于新构建的二分网络和(1)中的假设,分别计算了疾病节点间的相关性和微生物间的相关性。最后,设计一种可以利用多种数据资源来预测潜在关联关系的模型来预测潜在的疾病关联的微生物。通过实验可见,新构建的预测方法可靠有效。(3)本文的最后一章,分析了上述两个预测模型之间的联系与区别,同时讨论本文方法并给出下一步的研究任务和计划。