论文部分内容阅读
阿尔茨海默病(Alzheimer’s disease,AD)是一种最常见的痴呆,它的致病机理还没有搞清楚。为了深入理解它的致病机制,基因芯片微阵列数据及其分析变得很有意义,并且这方面的研究已经取得了一定进展。因此,本文先介绍了前人的工作:观察数据发现基因表达水平行向量之间的强线性相关性特征,进而利用主成分分析法对与AD相关的基因芯片微阵列数据进行降维处理,并发现列数据的紧致聚类特征,并基于此,设计一维聚类算法,估计出原始数据类的信息(类个数和类中心)。但是,我们发现尽管第一主成分已经占了大多数信息(约90%),但是剩余的10%的信息也是重要的。因此,本文提出利用一个能够吸取原有结果的经验对聚类结果进行再调整的高维算法想法,即迭代自组织数据分析算法,进一步对估计出来的类和类的个数进行优化,期望得到一个理想的聚类模式。然后利用该聚类模式,采用共轭表达判据和紧致破缺判据,识别出了37个AD候选基因,已有9个得到其他团队研究的支持。此外,对这些这些基因还做了生物学分析,得到一些AD深层次的信息:主要涉及细胞的信号传导(ECE1,PLD2和PHB),炎症(il17a),泛素标记蛋白降解(UBC)和蛋白质合成(rpl32,rps6,rpl23a和rps19)与AD密切相关。另外,本文还讨论了基因TPT1和TUBA1A对AD的潜在影响。最后,基于上述讨论本文给出了清晰明确的AD病潜在致病机制通路图。