含负项top-k高效用项集挖掘算法

来源 :计算机应用 | 被引量 : 1次 | 上传用户:jitic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
含负项高效用项集(HUI)挖掘是新兴的数据挖掘任务之一。为了挖掘满足用户需求的含负项HUI结果集,提出了含负项top-k高效用项集(THN)挖掘算法。为了提升THN算法的时空性能,提出了自动提升最小效用阈值的策略,并采用模式增长方法进行深度优先搜索;使用重新定义的子树效用和重新定义的本地效用修剪搜索空间;使用事务合并技术和数据集投影技术解决多次扫描数据库的问题;为了提高效用计数的速度,使用效用数组计数技术计算项集的效用。实验结果表明,THN算法的内存消耗约为HUINIV-Mine算法的1/60,约为
其他文献
无线Mesh网络(WMN)由许多网状节点组成,它提供了有效的Internet链接。接入认证安全是WMN快速普及的主要障碍,故提出一种基于区块链的无线Mesh网络认证机制。验证过程只需要比较用户提供的证书计算的哈希值是否与存储在区块链中的哈希值一致,与已有认证机制相比简化了认证流程,减少了认证延迟,提升了认证效率,解决了集中式架构容易导致的单点故障问题,达到分布式认证效果,区块链技术的引入为解决无线
大规模数据分析环境中,经常存在一些持续时间较短、并行度较大的任务。如何调度这些低延迟要求的并发作业是目前研究的一个热点。现有的一些集群资源管理框架中,集中式调度器由于主节点的瓶颈无法达到低延迟的要求,而一些分布式调度器虽然达成了低延迟的任务调度,但在最优资源分配以及资源分配冲突方面存在一定的不足。从大规模实时作业的需求出发,设计和实现了一个分布式的集群资源调度框架,以满足大规模数据处理的低延迟要求
针对功能磁共振成像(f MRI)数据的高维度小样本问题,提出谱聚类半监督特征选择(SS-FSSC)模型。首先利用先验脑区模板提取时间序列信号;然后选取皮尔逊相关系数与序统计量相关系数(OSCC)描述脑区间的功能连接特征,并对特征进行谱聚类;最后利用基于Constraint得分的特征重要性准则挑选出特征子集,并把这些子集输入支持向量机(SVM)分类器进行分类。实验通过在COBRE精神分裂症公开数据集
变化检测作为土地利用/土地覆盖检测的关键技术,其目的是在同一区域不同时期的遥感数据中检测出变化的部分及其类型。针对传统的变化检测方法中存在繁重的人工劳动和检测结果效果差等问题,大量基于遥感影像的变化检测方法被提出。为了深入了解基于遥感影像的变化检测技术以及进一步研究变化检测方法,通过对大量有关变化检测的研究进行整理、分析和比较,对变化检测进行了较为全面的综述。首先阐述了变化检测的发展历程;然后从数
针对目前词向量表示低频词质量差,表示的语义信息容易混淆,以及现有的消歧模型对多义词不能准确区分等问题,提出一种基于词向量融合表示的多特征融合消歧方法。该方法将使用知网(HowNet)义原表示的词向量与Word2vec生成的词向量进行融合来补全词的多义信息以及提高低频词的表示质量。首先计算待消歧实体与候选实体的余弦相似度来获得二者的相似度;其次使用聚类算法和知网知识库来获取实体类别特征相似度;然后利
针对目前动态手势识别计算复杂度较高以及对实验器材有相应要求的问题,提出基于多特征融合的动态手势识别。使用OpenPose得到手部关键点信息,建立手势模型,将坐标信息利用手部的结构关系进行处理,得到手部的角度和长度特征。将角度特征序列和长度特征序列进行融合,利用阈值设定过滤序列中的奇异点,使用FastDTW算法计算待测动态手势与手势模板库中的序列距离,得到预测手势动作类别。实验表明,该方法计算复杂度
航空发动机损伤是影响飞行安全的重要因素。当前基于计算机视觉的发动机孔探图像损伤检测存在两个主要问题:一是孔探图像背景复杂,使得模型对损伤的检测精度较低;二是孔探图像数据来源受限,导致模型可检测类别较少。为解决这两个问题,提出了基于Mask R-CNN的二分类到多分类递进式航空发动机损伤图像检测网络。通过在Mask R-CNN中增加二分类检测分支,首先对图像中的损伤进行二分类检测并对定位坐标进行回归
参数化密度估计算法和非参数化密度估计算法均无法高效地处理高维时间序列。针对这种情况,提出基于贝叶斯序列分割的高维时间序列在线分类算法。通过时间延迟嵌入将时间序列投影到重建相位空间,基于贝叶斯序列分割将时间序列分区,结合边际密度和copula变换计算每个区的密度。使用积分平方误差度量时间序列概率密度函数之间的相似性。实验结果表明,该方法对于时间序列的维度具有鲁棒性,能高效地估计时间序列的密度,获得满
在电信运维的容量预测过程中,存在容量指标和部署业务种类繁多的问题。现有研究未考虑指标数据类型的差异,对所有类型的数据使用同种预测方法,使得预测效果参差不齐。为了提升指标预测效率,提出一种指标数据类型分类方法,利用该方法将数据类型分为趋势型、周期型和不规则型。针对其中的周期型数据预测,提出基于双向循环神经网络(Bi RNN)的周期型容量指标预测模型,记作Bi RNN-Bi LSTM-BI。首先,为分
随着计算机网络技术的飞速发展,新型攻击手段层出不穷,而传统的静态被动防御手段难以有效应对。端信息跳变是一项网络动态防御技术,能够主动防御网络攻击,保护重要网络节点。该技术借鉴跳频通信技术的思想,通过伪随机地改变通信双方或一方的端信息,隐藏重要节点,增加攻击者的攻击难度和攻击成本,干扰甚至破环攻击者的攻击,实现网络主动防御。首先进行了端信息跳变技术研究现状的调查,按照跳变项进行分类并分析了优缺点。然