垂直数据格式挖掘频繁项集算法的改进

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:heiying123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的基于垂直格式挖掘频繁项集采用正交的方式两两进行比较耗费大量时间和产生的Tid集可能很大浪费存储空间的问题,提出了一种基于三角矩阵和差集的垂直数据格式挖掘频繁项集的挖掘算法。该算法利用差集解决了对稠密数据集进行频繁项集挖掘时的Tid集可能很大的问题,并且利用一种前提方法判断是否有必要连接产生候选频繁k+1项集,减少时间的开销,而且在存储上用三角矩阵的数据结构可以进一步节省存储空间。实验结果表明,本算法大大减少挖掘频繁项集时间和空间内存的开销。
其他文献
近年基于人工智能技术的自主学习型算法在信息推荐、动态定价情境下显现出如价格歧视、性别歧视等异常,逐渐引发学界对自主学习型算法问题的担忧。囿于自主学习型算法的不透
随着云计算、大数据以及移动互联网的发展,移动终端用户数据呈现出数据量大、噪声大、动态性及不确定性增强的趋势,影响了移动用户数据聚类准确率与效率。针对上述问题,提出
摘 要:航空维修业专业教学中,教学资源的作用至关重要,是影响教学质量和学生学习效率的直接因素,在资金相对匮乏的情况下,合理地利用自然物理现象以及生活中的常识、行业企业标准等与学生最为贴切的各种资源,以最小的经济投入获取相对较大的教学效果。针对不同基础的学生对知识理解和接受能力的不同,设置合理的课外学习任务,以工作过程、项目驱动为导向,由简单到复杂,由单一到综合,引导学生对工作任务的思考,发掘与课程