不确定数据的挖掘算法研究

被引量 : 0次 | 上传用户:lenvy11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术日新月异的发展,在金融、物流以及天体研究等众多领域,时刻都会产生和记录海量的数据。而多数情况下,这些数据都存在着误差或者仅是部分完整的,数据的不确定性导致传统的数据挖掘方法不再适用于不确定数据。本文研究不确定数据的挖掘算法,对不确定数据的频繁模式和最大模式的挖掘进行分析研究,并分别提出新的算法,丰富了数据处理的手段,提高了数据挖掘的效率。频繁模式挖掘是数据挖掘领域的核心问题,本文提出了一种基于垂直结构的不确定数据频繁模式挖掘算法ProEclat。ProEclat采用数据集的垂直格式表示,避免了对数据集的多次扫描,使用两阶段模型的频繁项集判断方式,大幅提高了计算效率。实验证明,ProEclat伸缩性良好,性能优于同类算法。最大模式挖掘是频繁项集挖掘的重要研究分支,本文提出一种基于深度优先的不确定数据最大模式挖掘算法U-GenMax。U-GenMax采用多步回退机制、项排序策略、局部投影等剪枝优化技术,减少了算法运行的时间。实验和分析表明,U-GenMax性能良好,尤其适用于稀疏数据集和支持度较高的稠密数据集。
其他文献
一带一路战略的提出,为西部高原地区交通建设发展带来新契机。然而,西部高原地区气候寒冷,自然环境恶劣,地质灾害频发,导致高原严寒山区取费标准已不能满足公路工程计价的需
钛合金凭借独有的特性,在航空航天,石油能源,生物医用等领域的起着重要作用。由于钛合金加工困难且成本较高,导致了与钛相关的产品价格居高不下。1970年半固态成形技术被提出
自然环境下,氡气在衰变的过程中能够放射出α、β和γ等射线,这些射线的电离能较高,尤其是α射线,能够促使周围空气发生电离,产生空气离子,而空气负离子又能够提高空气的清洁
由于石油燃料的应用领域和需求量的不断增加,能源短缺和环境污染的状况变得更加严重,因此石油代用燃料的发展越来越受到大家的重视。甲醇燃料由于其清洁、经济性好、来源广泛
电缆桥架安装是电气安装工程的一大主要分项工程,电缆桥架设计的是否合理,既关系到桥架施工的质量,又制约电缆敷设工程,会影响整个的电气工程。
目的调查老年乳腺癌患者植入静脉输液港术后并发症发生情况,并分析其影响因素。方法回顾性分析80例中老年乳腺癌女性患者的临床资料,将术后发生并发症的患者纳入观察组,其余
近些年,随着我国产业不断进步,以创新驱动产业发展、提高产业竞争水平逐渐成为共识,而构建创新支撑平台则成为产业创新的有力支撑部分。与发达国家相比,我国创新支撑平台建设
随着现代信息技术的快速发展,以及水利现代化建设进程不断加快,工程建设管理开始由传统型的经验管理逐步转换为现代化自动化管理。对现代水利工程的自动化控制进行了分析。
目的:观察姜黄素对糖尿病大鼠氧化应激的影响。方法:用链脲佐菌素(streptozotocin,STZ)腹腔注射建立糖尿病大鼠模型。将大鼠随机分为正常对照组、糖尿病组、姜黄素灌胃组。成
随着智能交通系统的不断发展,车载网(Vehicular Ad-hoc Network,VANET)技术受到了众多高校和企业研究人员的关注,其中基于车间通信技术研究的关注度最为突出。车载网中节点移