基于信息熵的相对离群点的检测方法:ENBROD

来源 :南京大学学报(自然科学版) | 被引量 : 0次 | 上传用户:huangxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种检测离散属性数据集中相对离群点的算法.目前已有的关于离群点的检测方法大多关注连续属性的数据集,南于离散属性值之间并没有类似于连续属性值之间那样固有的距离度量关系,故不能简单的把用于连续属性数据集的检测算法应用到离散属性数据集巾来.本文首先引入了一种新的信息熵增量的概念——去一划分信息熵增量,通过形式化分析得到了其性质.然后,在去一划分信息熵增量的基础上,给出了每个对象所对应的相对离点群因子(ROF)的定义.每个对象的ROF是相对的,因为其只取决于这一对象的邻域,接着,提出了ENBROD算法来实现对
其他文献
干巴菌(Thelephore sp.)美味可口,营养丰富,为云南群众十分喜爱的珍贵野生菌之一,其售价在昆明居野生食用菌之冠。现已日趋减少。过去一般认为此菌属菌根菌,利用人工的方法
今年是爱因斯坦相对论诞生100周年,也是爱因斯坦逝世50周年.全世界人民都在纪念这位伟大的人物.我们关注与加强科学文化与人文文化的交融,也正是为了更好地纪念他.他说:物理
伴随着新一轮基础教育课程改革,校本课程的开发如雨后春笋。我校为适应农村学生的实际,开发了校本教材《语文阅读教学训练点》。经过一段时间的课堂实践,已逐步完善,成绩显著
以某设备的超高压组合缸体为研究对象,建立组合缸体模型。首先对传统组合缸体进行有限元分析,然后对外形相同的超高压组合缸体的两种自增强工艺进行有限元模拟和对比研究。研
针对传统meanshift跟踪算法不能有效消除目标内包含的背景信息、不能自适应连续视频序列中背景的明显变化,以及不能解决光照变化带来的目标颜色特征信息变化的问题。文章提出
经济社会发展中,计算机网络技术发挥着十分重要的作用,尤其是区域经济发展中,计算机网络技术的积极作用更是显著。本文在深入分析计算机网络技术对区域经济发展的影响的基础
本文论述了大米品质改良在我国的实际意义,对大米品质的影响因素和品质改良方法作了分析,提出了大米品质改良的初步思路。
2020年春节我国突发了新型冠状病毒肺炎疫情。各公立医院疫情防控物资严重紧缺。部分公立医院在实际工作中突破了原有的内部会计控制流程的规定,出现了随意采买和使用的现象
【正】 一郑玄注经,多明声训,其例至精。言及声训,当推汉代集声训之大成的两部书,一是班固的《白虎通》,一是刘熙的《释名》,尤以后者更负盛名。而郑玄的声训,由于分散在大量
农村人力资源的合理开发,是带动农业顺利走向现代化的必要条件之一,对于新农村建设意义非凡。我们需要将当地农村的经济、科技、文化等方面的优势充分发挥出来,完善农村成人教育