论文部分内容阅读
一方面,由于人们生活方式的巨变和生活水平的提高,导致糖尿病患病率急剧增加,发病年龄呈现低龄化。而糖尿病引发的糖尿病性视网膜病变、肾脏及神经病变、心血管病变等并发症,也严重威胁到了人类的健康和生命。另一方面,随着互联网技术的不断发展和医疗信息化的不断完善,许多医院累积了海量的医疗数据,数据规模极大、结构不统一以及来源多样等问题导致传统的数据分析途径难以高效地提取有价值的信息。因此,本文基于改进后的ABC算法和Apriori算法对海量糖尿病相关数据进行特征提取和关联分析,设计开发了一款糖尿病辅助诊断系统,辅助医护人员进行糖尿病诊断,也为用户自诊提供有效手段。主要工作如下:(1)使用改进算法对糖尿病特征集进行特征选择,针对经典ABC算法中观察蜂局部寻优能力弱的不足进行改进,通过局部搜索策略优化观察蜂的寻优机制,进一步细化并扩大解的搜索范围。通过实验对比经典算法和改进算法,发现改进算法能有效过滤冗余特征,且在特征子集的质量、收敛速度和分类准确度方面有明显改进。(2)使用Apriori算法对糖尿病各大高危因素进行关联分析,针对经典算法重复扫描数据库,导致大量时间耗费于I/O操作,以及频繁项集自连接时产生大量冗余等两大缺陷,通过将事务数据库转换为布尔矩阵,使用压缩矩阵的方法对计算方式进行改进,提高算法性能。通过实验对比经典算法和改进算法,证明了改进算法在相同最小支持度下运行速度更快、项集冗余更少。(3)设计并开发了基于改进ABC和Apriori算法的糖尿病预测系统,并对各模块进行了单元测试和集成测试,最终实现了辅助诊断的预期目标。该系统不仅提高了医护人员的诊断效率和准确率,同时为自诊患者提供了及时准确的疾病预警。