论文部分内容阅读
乳腺癌是由于乳腺细胞在各种内外致癌因素的作用下,失去正常特性而异常增生的疾病。因此基于乳腺癌图像诊断依据的重要因素的研究对于乳腺癌疾病诊断具有非常重要的指导意义。本文在数据预处理中采用单因素方差分析方法确定重要因子排除非重要因子,使得因缺失非重要因子的残缺项变得完整,从而减少了缺失项的影响,对于经处理仍然含缺失值的项进行舍弃。同时对项集进行单因素方差分析能帮助解决支持度阈值的设置难题,支持度阈值取到恰好能排除非重要项的值。实验证明这种方法是可行且准确的。经过预处理开始关联规则的挖掘,再对关联规则进行相关性评价。实验证明能有效挖掘出相关关联规则。本课题的主要工作是:1、通过经典的关联规则挖掘Apriori算法和动态挖掘PC-FSA算法来分析当前关联规则挖掘算法的优缺点。2、在此基础上,针对关联规则挖掘算法存在的不足,提出了PC-CFSA算法。最后,使用SPSS统计分析软件对算法正确性进行验证。3、利用自己提出的新的相关关联规则挖掘算法,对乳腺癌图像数据进行分析,进一步验证理论。