分类型矩阵数据的孤立点检测算法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:Aweichunxing890620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
孤立点检测是数据挖掘中的一个重要问题,旨在发现隐藏在大型数据集中的有用的异常对象和异常模式,并已广泛应用于信用卡欺诈检测、网络监测、电子商务、故障检测、恶劣天气预报和卫生系统监测等领域。现有的孤立点检测算法输入的数据集是包含9)个对象的集合且每个对象对应一条记录,但是在实际应用中,一个对象通常对应多条记录,本文中称包含多条记录的对象为矩阵对象,包含矩阵对象的数据集为矩阵数据集。目前,还没有有效的算法可以检测矩阵数据集中的孤立点,如果使用现有的孤立点检测算法来处理矩阵数据,最直接的方法是压缩和转换数据,但是,在数据压缩和转换的过程中通常会有大量信息被丢失,不足以完全反映用户的真实行为。因此,本文针对分类型矩阵数据集中的孤立点检测进行了深入细致的研究和探讨,主要工作如下:(1)由于矩阵数据集中的对象包含多条记录,所以可以把每个矩阵对象看作一个小数据集,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义矩阵对象的孤立因子,提出了一种基于信息熵的孤立点检测算法。(2)数据属性之间通常有复杂的相互作用,所以还需要考虑属性间相互作用对矩阵数据集孤立点检测的影响。因此在计算矩阵对象自身的内聚度时通过互信息度量了属性间的相互作用,进而提出了一种基于信息熵和互信息的孤立点检测算法。总之,本文针对分类型矩阵数据集如何进行孤立点检测进行了研究,提出了新的算法,并在真实数据集上对新算法的有效性和扩展性进行验证。本文的研究为矩阵数据集的孤立点检测提供了新思路与新方法,在实际应用中有一定的理论和使用价值。
其他文献
随着N市社会经济的快速发展,人们的收入也不断提高,财富也日益积累,因此人们对投资理财的需求也逐渐增加,这给农业银行N分行发展个人理财业务带来了很好的机遇。但与此同时,
研究目的:探讨CD137信号是否通过STAT6/PPARδ通路调控动脉粥样硬化巨噬细胞M2极性转变。研究方法:(1)体内实验将68周龄ApoE-/-雄性小鼠分为5组,包括对照组、CD137激动组、CD13
萼花臂尾轮虫(Brachionus calyciflorus Pallas)隶属于轮虫动物门(Rotifera),单巢纲(Monogononta),游泳目(Ploima),臂尾轮虫科(Brachionidae),是最常见的淡水浮游动物。由于其个体小(约100-500μm)、生命周期短(5-7d)、并且在实验室易于培养、衰老特征明显等特性,被认为是极具潜在价值的衰老生物学研究的模式生物之一。mTOR
丝裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)是细胞内的一类丝氨酸/苏氨酸蛋白激酶。MAPKs信号转导通路存在于大多数细胞内,在将细胞外刺激信号转导至细胞及其核内,并引起细胞生物学反应,如细胞增殖、分化、转化及凋亡等的过程中具有至关重要的作用。TAK1(Transforming growth factor-βactivated kinase-1),
清朝末期,在洋务运动的影响下清政府建立了北洋海军舰队,并让其进驻威海卫刘公岛,因此让坐落在华夏东部边陲的渔民小岛突然进入了国人的视线。而之后1894至1895年的甲午中日
扁蜉科(Hepatgeniidae)为蜉蝣目中物种多样性最高的科之一,目前已报道36属600余种。其三亚科之一的溪颏蜉亚科(Rhithrogeninae)在亚洲分布广泛,但目前我国对其的研究仅有零星报道,描述大多简略,且未有基于分子证据的相关研究,相较于国外研究水平十分不足,因此急需进行系统的整理与分类。本文对实验室近年从全国多地采集的高翔蜉属Epeorus、赞蜉属Paegniodes以及微动蜉属
目的:探讨miRNA-100在宫颈癌中的表达情况,以及改变其表达水平是否可以影响宫颈癌细胞的恶性生物学行为。方法:1.采用qRT-PCR检测细胞系(宫颈癌细胞HeLa,SiHa和人永生化角质
目的本研究旨在运用脐针疗法治疗围绝经期失眠,通过与常规经络辨证取穴疗法相比较,观察其疗效,评定量表,并探讨脐针疗法在此病证中治疗的优势,为推广脐针治疗围绝经期失眠提
目的:探讨HER2阳性乳腺癌改良根治术后发生首次复发转移患者肿瘤的异质性。方法:应用回顾性研究方法,收集2006.1.1至2017.12.31于河北医科大学第四医院行改良根治术,经术后病
[目 的]应用静息态功能磁共振(Resting-state functional magnetic resonance imaging,rs-fMRI)成像的局部一致性(Regional Homogeneity,ReHo)技术,进行以下研究:1、分析基线