频繁项相关论文
数据流上的频繁项挖掘是数据流上的一项重要技术,它在各个研究和应用领域都起着重要的作用。现有的数据流上的频数挖掘算法主要包......
数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘技术成了商业智能的核心技术,被广泛应用到了诸多领域,引起了......
随着互联网的发展,世界已经走向信息经济时代;信息资源并不稀缺,稀缺的是发现信息资源、综合信息资源的手段。搜索引擎就是因此应运而......
数据流是按时间顺序到达的一个连续数据组成的一个序列。近年来,挖掘数据流的应用越来越广泛。在动态数据集上挖掘频繁项是一项困......
挖掘数据流的频繁项已受到广泛关注,研究者们提出了一些高效的数据流上挖掘频繁项的算法,尽管这些算法能够比较好的找到频繁项,但对频......
图像显著区域检测是计算机视觉领域的研究热点,图像显著区域检测的目的是模拟人的视觉注意力机制,选择出图像中最吸引人的部分,为......
近年来,随着信息技术的快速发展,个人和企业产生了大量的数据信息。为了向用户提供更好的个性化服务,各种社交组织更加热衷于收集......
滑动窗口是一种对最近一段时间内的数据进行挖掘的有效的技术,本文提出一种基于滑动窗口的流数据频繁项挖掘算法.算法采用了链表队......
针对UF-growth算法构造大量树节点和分支的局限性,且不断计算候选数据项支持度的不足,提出压缩UF-tree算法。压缩UF-tree算法改变建......
针对基于约束的不确定数据频繁项的经典挖掘算法——U-FPS算法的不足,提出了适用于基于约束的不确定数据的新算法——UC-Eclat挖掘......
分析了数据流频繁项挖掘算法EC的不足之处,如不能准确地挖掘最近一段时间内数据流的频繁项。提出了一种频繁项样本特征复合四元组......
分析了目前降载技术的不足,提出了一种面向挖掘流数据频繁项集的降载策略。该策略采用了基于元组出现频率的语义删除策略,优先删除......
针对Apriori时间性能较低的缺陷,结合二项集支持度矩阵提出了Apriori改进算法Apriori-M。在扫描数据库时生成一个二项集支持度矩阵......
对空间数据库中有效数据频繁项检测,可以提高有效数据搜索的效率。进行有效数据频繁项检测时,应计算频繁项集的支持度概率和频繁概......
传统的分布式数据流挖掘模型是一种挖掘结果中逐层进行的层次模型,通信带宽是一个瓶颈。为了减少分布式数据流结点的通信,本文采用一......
频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并......
在Apriori算法的基础上,提出一种基于十字链表的关联规则挖掘算法。该算法能够快速得到每个候选项的支持度,从而有效的发现频繁项集......
概率数据是从很多隐含模糊数据或不确定的数据的数据资源中生存的数据,而在概率数据上计算统计信息也已经引起了广泛的关注.频繁项......
本文利用FP—tree压缩数据和只扫描数据库两次的特性,设计一种算法使得所有交易记录都可以完整地压缩在同一树结构中,并使其能在数据......
在数据挖掘中关联规则中是一个重要的研究方向。Apriori算法是关联规则中最著名的算法。,本文分析了Apriori算法存在的不足,与可以改......
当前数据频繁项检测方法往往具有数据存储结构复杂、维护困难和复杂度高的弊端;针对这种情况,提出一种新的分布式空间数据库中有效......
数据流频繁项是指在数据流中出现频率超出指定阈值的数据项.查找数据流频繁项在网络故障监测、流数据分析以及流数据挖掘等多个领域......
为了提高大数据在存在类间闭频繁项干扰下的分类提取能力,提出了一种基于频繁项自适应学习的大数据优化分类算法.采用离散高斯随机......
数据流的无限性、连续性和速度快等特点,使得挖掘出所有准确的数据流频繁项通常是不可能的.算法的空间复杂度和时间复杂度通常是评价......
从数学规划的角度重新表述了单维布尔型频繁项挖掘问题,利用新定义的加法和数乘及范数运算将其归结为一个非线性0-1规划问题,并利......
频繁集的挖掘问题是数据挖掘的关键问题,本文提出了一种基于频繁树的挖掘频繁集的新方法,该算法从频繁项开始搜索、筛选产生符合要......
网格环境下,分布式数据源的更新一致过程无法实现.通过计算分布式数据流的频繁项,进行有选择的数据更新清洗,是当前研究的热点.本文提出......
针对现有挖掘方法存在运行效率低下与精准度受限的问题,提出基于粒度计算的大数据集频繁项挖掘方法。通过分析大数据集中数据流的......
频繁模式挖掘是数据挖掘的精髓,并且在上个世纪被广泛研究。概述了数据流频繁模式挖掘的技术发展水平和发展背景。然后给出一些概......
由于数据流的高速产生性、强流动性及变化不稳定性的需求,数据流算法应在有限存储空间里实时准确分析数据,提取有用知识。在允许的误......
频繁项查询在网络监控、网络入侵检测、关联规则挖掘等方面是一项非常重要的技术.该技术在静态的不确定数据中已经得到了深入的研究......
在Apriori算法基础上,给出一个改进的关联规则挖掘算法.改进的算法只需对数据库进行一次搜索,能大量减少I/O次数,且内存开销适中.......
流数据频繁项挖掘是一项重要的研究课题,是其他流数据挖掘任务的基础.Lossy Counting算法是第一个近似的流数据频繁项挖掘的算法,......
查找数据流中的频繁项是数据流挖掘中的热点问题之一。挖掘数据流频繁项在网络流量监测、金融服务等多个领域有着广泛的应用。本文......
挖掘数据流的频繁项已受到广泛关注,经典的频繁项挖掘算法尽管能够比较好地找到频繁项,但对频繁项频数的估计往往存在较大误差.SRoEC(s......
对分布式流数据中频繁项的发现算法进行了研究,利用一种新颖的分布式概要算法(DSA)来发现从叶子节点直至根节点的概要结构,通过在......
提出了一种流数据上的频繁项挖掘算法(SW-COUNT)。该算法通过数据采样技术挖掘滑动窗口下的数据流频繁项。给定的误差ε,SW-COUNT......
数据库的访问频度是影响关联规则挖掘性能的关键因素之一。通过研究FP-tree算法,提出了一种基于FP-tree的快速构建算法,使FP-tree......
为了更好的挖掘数据流,对传统的滑动窗口机制进行改进,提出一种大小可变的滑动窗口机制的数据流频繁集挖掘算法DS-stream算法。该算......
在当前骨干网络链路速率呈几何倍数增长的情况下,实时准确地挖掘出网络流中的频繁项对于网络管理和网络安全具有重要的意义.在SS(sp......
从输入隐私保护和输出隐私保护2个角度介绍了隐私保护关联规则挖掘的有效方法。输入隐私保护采用数据扭曲的策略,输出隐私保护采用......
目前数据流频繁项近似挖掘算法大多采用误差参数控制挖掘的结果,时间与内存开销越高,挖掘结果的正确性越低.针对这样一个问题,提出了渐......
攫取流数据处理在住房公积金信息数据库之中的应用为主要研究对象,旨在对住房公积金信息数据库之中所出现的时间窗口瓶颈加以缓解......
关联分类具有较高的分类精度和较强的扩展性,但是由于分类器是由高置信度的规则构成,因此有时会出现过拟合。因此考虑在fp-growth挖......
近几年,随着通信、网络等技术的飞速发展,在各个领域经常都会产生大量的信息数据。因此,如何使用有限存储空间进行快速准确地挖掘数据......
通过建立基于分组俘获文件产生网络流的模拟环境,对计数型算法和略图算法两类经典的频繁项挖掘算法的适用性进行验证,检验采用界标......
信息存储技术和通信技术的飞速发展使得越来越多的文字信息开始以计算机可读的形式存在,并且其数量每天都在增加和更新。对大量电......
随着信息技术的快速发展,流式数据以不同方式出现在了众多领域的应用之中。包括网络流量的监测、金融应用、通信数据管理、网络安......