基于分类的加速EM缺失数据填充算法

来源 :北京印刷学院学报 | 被引量 : 0次 | 上传用户:jasmineonbridges
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘的整个过程中, EM 算法因其数值计算的稳定性、 实现上的简单性, 可靠的全局收敛性, 被广泛应用于处理数据不完整问题.针对 EM 算法收敛速度慢, 算法高度依赖初始值的选择, 使用 KNN 算法的分类结果作为 EM 算法的初始使用范围, KNN 算法根据挖掘目的的不同选择不同的特性, 然后利用增量式 EM( IEM)算法按 E 步M 步迭代反复求精, 快速有效地得出填充缺失数据的最优值; 该算法大大加快了收敛速度, 加强了聚类的稳定性, 数据填充效果显著.
其他文献
随着电子信息技术的不断发展,遥感技术也取得极大地进步,对于矿山开采项目而言,前期地质环境调查有着重要意义,而遥感技术可以提高地质调查的效率,将调查人员从重复枯燥的工
随着国际交流与合作的日趋频繁,英语逐渐成为人们必须掌握的语言,英语口头交际能力显得尤其重要。然而由于种种原因,高中生的英语口语表达能力依旧是薄弱的环节,。传统教学重视语
目的探讨血清脂蛋白(a)[lipoprotein(a),LP(a)]在胆囊结石伴胆囊炎疾病中的临床意义。方法收集2017年3月~2018年9月临床确诊为胆囊结石伴胆囊炎患者126例和92例胆囊炎患者的
目的探讨贵州地区汉族阿尔茨海默症患者细胞色素P4502C19(CYP2C19)基因多态性及代谢表型的分布,为临床个体化用药提供理论依据。方法以DNA微阵列技术检测227例贵州地区汉族阿
绘本是儿童人生中的第一本书,是儿童阅读的起点,是儿童获取外界信息的重要渠道。优秀的绘本以单纯质朴的形态,反映了童心的纯真、生命的哲理、处世的方法和自然的意趣。在创作手
目的探讨尿液10项生化指标对高血压肾病(HTN)的比较分析与优选出的尿液5项生化指标对HTN的诊断价值。方法测定43例HTN患者、52例高血压患者和55例健康体检者的尿液10项生化指
目的研究T细胞型急性淋巴细胞白血病(acute lymphoblastic leukemia,ALL)患者HOX11L2基因的表达及其临床意义。方法采用回顾性分析方法对50例患者性别、年龄、白细胞数量、FA
我国是世界上食管癌的高发区,其最常见的组织学类型是鳞状细胞癌。尽管食管电子内镜检查和黏膜活检是高危人群筛查和早期发现诊断的有效手段,但并没有作为普查手段在食管癌高
目的应用两个厂家生产的试剂盒平行检测新型冠状病毒(SARS-CoV-2)感染的肺炎(COVID-19)患者样本,对其检测效果进行实验室应用评价。方法A,B两试剂盒共同靶基因为ORF1ab和N,B
【摘 要】随着改革开放的不断发展,英语作为国际语言,其地位在不断提升。初中英语教学作为英语教学的基础阶段,其重要性不言而喻。这就要求初中英语教学应将培养学生应用实践能力为侧重点,培养学生综合应用英语的能力。而实践能力中,英语阅读水平是主要内容之一。所以,在教学中教师要注重培养学生的英语阅读能力。接下来笔者将结合实践教学,浅析阅读教学中存在的问题,并就此提出一些意见和建议。  【关键词】初中英语