论文部分内容阅读
现代科技的发展,尤其是生物实验技术和下一代基因测序设施的发展,每天都会产生大量的生物实验数据。为了有效的分析和利用这些数据,需要构建基因调控网络,去挖掘隐藏在数据背后的生物学现象、原因。现在如何更好的实现基因调控网络的构建,已经成了生物信息学的十分热门研究方向之一。在这篇文章中,通过对比用于建立基因调控网络的一般模型,发现贝叶斯网络模型最适用于建立基因调控网络,同时采用了正态分布的思想给数据填充缺失值,并调用R语言中有关包,对比分析爬山、禁忌等算法在构建基因调控网络上的优劣。通过构建基因调控网络,我们可以探索到各个基因之间的相互影响和调控关系。这可以指导我们更加清楚的了解疾病产生的根源,进而能够有效的诊断出是什么疾病,并根据基因表达的水平,设计具有针对性地药物,这对现代医学、药学地发展有着相当重要的促进作用。本文主要研究了如何通过贝叶斯网络模型来模拟、构建真实的基因调控网络,为了提高所构建网络的精确程度,采用了BDE评分函数、贪婪的爬山算法等手段来实现,同时还采用了信息学的互信息等知识来融合多源的生物实验数据。实验证实,该算法有效的提高了所构建网络的精确程度,具有一定的实用意义。