论文部分内容阅读
目的应用分类树模型对影响乳腺癌的主要危险因素进行筛选,并探讨该方法在流行病学资料分析中的应用价值。方法以嘉善县现场流行病学调查中84例女性乳腺癌患者为病例组,采取单纯随机抽样方法选择273名女性健康居民作为对照组。采用详尽卡方自动交互检测法(Exhaustive CHAID法)建立分类树模型对调查结果进行危险因素筛选,使用错分概率Risk值和ROC曲线下面积对模型进行评价。结果分类树模型从全部105个候选变量中筛选出9个危险因素,其中职业是最重要的影响因素,工人、教师及退休人员的乳腺癌发生概率显著高于其他人员。而足月孕产3胎及以下,曾去医院进行乳腺检查,药物治疗、射线照射、外科手术等导致绝经,初潮年龄为13岁及以下,不食用新鲜虾蟹,食用腌鱼以及过多和从不食用海带紫菜类产品都是乳腺癌的危险因素。另外,模型显示经常参加体育锻炼在不同人群中对乳腺癌的影响效果有所不同。模型错分概率Risk值为0.174,利用预测概率绘制的ROC曲线下面积为0.872, 与0.5比较具有显著的统计学意义,模型拟合效果很好。结论分类树模型不仅可以有效挖掘筛选出主要的影响因素, 还可以对研究变量科学定义分界点,展示变量间复杂的相互作用,在流行病学研究中具有较高的应用价值。