论文部分内容阅读
目的:应用惩罚logistic回归模型(Penalized logistic regression.,PLR)解决传统logistic回归不能分析高阶交互作用的问题,并将PLR与现阶段国外广泛用于分析基因—基因、基因—环境交互作用的多因子降维法(Multifactor dimensionality reduction, MDR)进行对比分析,阐明二者在完成交互作用分析时各自的优劣势及其适用条件,为复杂的生物医学现象交互作用解释与分析提供合理的方法学依据。方法:介绍MDR分析原理及MDR交互作用分析技术。介绍惩罚logistic回归模型与原理。针对传统Logistic回归参数估计中遇到的样本含量问题,检测低阶、高阶交互作用能力问题等进行模拟研究,全部过程在R软件中编程实现。结合实例应用,进一步对比研究PLR、MDR解决医学应用问题,阐明其适用条件以及不同方法分析交互作用的优势。结果:模拟研究与实例分析表明,不同的调整参数λ对惩罚logistic回归模型的分析结果会产生较大的影响;调整参数λ使得统计量C得分最小的模型偏差最小,得到的估计系数相对较稳定,是推荐采纳的最佳模型。经PLR与LR的对比模拟研究,认为PLR偏差更小,得到的模型更稳定。尤其在样本量低于200时,惩罚Logistic回归模型显示出了更多的优势。交互作用检测能力模拟研究显示,在低维交互作用检测中,惩罚Logistic回归表现出MDR无可比拟的优越性。在高维或高阶交互作用检测时,MDR和PLR检测交互作用的能力相近,均能灵敏地检测出交互作用。即使加入干扰项后,也不会降低其检测交互作用的能力。MDR对高阶交互作用较敏感,能够检测出各种类型的交互作用,而惩罚Logistic回归更适合于相乘模型的交互作用分析。结论:惩罚Logistic回归、MDR与其他方法相比,更能有效得检测出多因素交互作用的存在。本文经过模拟研究与实例分析得出如下结论:(1)当样本含量较小时传统Logistic回归估计结果欠稳定;样本量低于200时,惩罚Logistic回归更具优势。(2)由于MDR在检测低阶低维交互作用方面的能力不足,而惩罚Logistic回归更适合于相乘模型的交互作用分析,对存在其它类型交互作用资料的分析,可以结合广义相对危险度模型或结合其他方法分析、处理。