论文部分内容阅读
本课题利用基因表达谱数据,应用生物信息学方法和数据挖掘技术展开研究,旨在解决特征基因选择及基因功能预测的相关问题。
本文从无监督学习方法入手,对所研究的基因进行聚类,并整合分析所得的聚类结果,目的是避免聚类数目不同带来的偏差,构建基因关联强度矩阵来体现基因之间的关联;展开单特征基因选择和多特征基因簇挖掘,通过挖掘hub基因选择与hub基因高度相关的基因簇,从而发现体现基因互作关系的基因簇。同时对挖掘出的基因进行功能鉴定可以从分子水平解释疾病发生的机理。
本文在表达相似的基因具有相似或相同功能的前提下,利用已注释基因的信息构建类表达谱,根据基因功能与基因表达之间的关系,寻找在功能上与表达上都具有的hub基因,运用hub基因类映射的方法进行功能预测。