论文部分内容阅读
目的探讨在基因表达谱数据分析中用主成分分析方法结合层次聚类法与K-均值聚类方法两种分类方法对组织样品分类的分类效果.方法用主成分分析方法对数据降维后进行聚类分析,与不经主成分分析直接聚类,并结合筛选与组织样品分型相关的基因的各种筛选水平,评价聚类效果.结果用约当指数进行评价两种聚类方法:经主成分分析后用提取的主成分聚类与不用主成分的直接聚类效果不同;不同筛选相关基因的筛选水平对聚类效果也有影响.结论对组织样品做聚类分析时,主成分分析能提高聚类质量,合理地筛选差异表达基因的方法能提高聚类效果.