基于无监督学习的数据清洗算法

来源 :吉林大学学报(信息科学版) | 被引量 : 0次 | 上传用户:wq52131
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决数据仓库中相似重复记录的数据问题,提出了基于无监督学习的数据清洗算法。该算法采用基于Hebb ian假设的自适应学习方法,并通过相似度确定奖励和惩罚等级。在学习过程中根据需要增加新的聚类,在学习结束后,通过分析聚类情况删除错误的聚类,从而避免了死神经元问题并使聚类更加准确。实验表明,该算法能准确地完成实体识别。
其他文献
第一部分川崎病并发冠状动脉损伤的临床分析目的:分析和探讨川崎病并发冠脉损伤的危险因素,指导临床治疗,改善预后。方法:回顾性分析2018年01月至2019年12月在苏州大学附属儿
蜜炙饮片是中药配方中常用的一类中药,因饮片蜜炙后的糖分,水分含量增多,在贮藏过程中容易受潮,粘连、霉变、虫蛀等,较难保管与久贮,对易虫蛀的饮片应贮存在冰箱内冷藏。
<正> 湖北省枝江市人武部近年来按照“调整布局、精干队伍、改善装备、加强训练、提高快速反应能力和战斗力”的工作思路,狠抓民兵应急分队军事训练质量。一是加强组织领导,
为了提高《数值分析》的教学效果,本文主要阐述了应用Matlab辅助教学的好处,把教学的互动性、可视性、生动性以及实践性等完美结合在一起,并给出一些相应实例进行理解.
古诺(Gounod,1818-1893)是19世纪法国著名的作曲家,他的成名作《浮士德》给抒情歌剧带来了新生。而古诺的《浮士德》的成功之处在于,它不是对“浮士德”哲学意义上的直接探索
<正>为提高民兵遂行非战争军事任务能力,近年来广东省佛山市顺德区以落实新编民兵军事训练与考核大纲为抓手,全面加强民兵应急分队军事训练。
现阶段,国家推进供给侧改革,社会经济消费全面升级,企业积极创新转型,呈现出一种全新的业态局面,同时互联网和新技术的融入使新零售模式更加适应企业需求。这种新型的盈利模式引起了众多企业的关注,纷纷顺应潮流,重构零售业态,此时,R咖啡以一种强劲的姿态进入了人们的视野,其“烧钱”式的新零售模式使大家怀疑,R咖啡是否是下一个ofo。但是在对市场进行了一段时间的适应后,R咖啡的新零售模式有了成效,开始渐渐向有
当《春韵》2009春节文艺晚会在益阳大剧院隆重上演时,益阳广电旗下六大媒体照例进行了同步直播。晚会不仅流程连贯,一气呵成,而且无论是现场观众还是电视机前的观众都不约而
一、整体印象南通市竹行小学源自私塾,历史悠久,经历百年。学校布局合理,环境优美,健体尚美氛围浓厚,这是一所有温度、有深度、有厚度,师生幸福指数高,办学效益显著的百年老
本文以石墨烯(GR)和单壁碳纳米管(SWNTs)为修饰剂,研究其对金电极的增敏效果.并以邻氨基酚为功能单体,槲皮素为模板分子,于金电极表面通过电聚合制备对槲皮素具有特定选择性的分