频繁模式挖掘技术研究及其在供应链管理中的应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:ji55643212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁模式挖掘是数据挖掘的一个重要内容,由于处理的数据量巨大,并行挖掘算法受到越来越多的重视,但是在具体应用领域还有许多亟待解决的问题。本文针对多重支持度频繁模式挖掘、特殊数据源上的数据挖掘等特殊问题进行研究,在一个新的面向视图的分布式共享内存并行编程环境VODCA下,提出了频繁模式挖掘的几种新的算法,并且应用到再制造/制造集成系统供应链管理中。首先,针对CD算法的通信量较少,能够在分布式共享内存系统中获得较好性能,但是没有有效的剪枝策略的特点,提出了带有事务删减的CD算法。该算法首先采用改进的层次聚类方法对数据进行分类,获得具有不同项目集合的数据子集,采用动态任务分配策略在不同处理器之间分配计算任务。在进行第k次数据库扫描时,根据事务中是否含有k-频繁项集,对数据库中的事务进行剪枝,由于预处理过的不同数据子集所包含的项目集合不同,起到对某些数据子集进行剪枝的作用。第二,为了实现用多重支持度发现更多长模式的目的,提出了从冗余的FP-tree挖掘频繁模式的方法。利用从条件FP-tree可以直接产生频繁项集的特点,根据模式长度改变支持度阈值,产生支持度不同的模式。约束函数采用分段函数实现,具有简单、灵活的特点,允许用户指定最小模式长度和支持度范围,能够方便地发现用户感兴趣的长模式。第三,稀疏数据源是数据挖掘任务中常见的一种数据源类型,本文在分析频繁模式挖掘中各种已有的数据结构基础上,提出了一种压缩存储稀疏数据源的链表结构,并在此基础上提出了稀疏数据源频繁模式挖掘算法,实现了高效挖掘稀疏数据源频繁模式的目的。详细讨论了VODCA系统环境下视图的划分依据和使用。最后,针对再制造/制造集成系统供应链管理中的两个关键问题:回收商选择问题和专业拆解中心选址问题,讨论了频繁模式挖掘算法在这类问题中的应用,提出了回收商绩效评价系统模型,介绍了关键属性的选取和处理方法。采用基于χ~2统计的有监督属性量化方法和属性值映射方法,将数据源处理成为稀疏数据集,寻找属性之间的关联关系,为问题中各类评价指标的确定提供指导。
其他文献
铝质餐具,长期使用易造成铝在人体积累过多,导致衰老和记忆力减退.铜质餐具,正常人每天需吸收5mg铜,故铜质餐具对健康有益,但长期使用,易引起低血压,精神障碍和肝脏部分坏死.
本文围绕计算机辅助几何设计领域中的两类占有重要地位的图形处理技术——几何逼近技术以及图形转换技术展开深入研究.鉴于计算机辅助几何设计中的几何逼近问题主要针对特定的
协同产品开发中,数字化产品模型是设计优化、性能分析、评测和仿真运行的基础,如何将不同阶段的产品模型有效地进行集成,最大限度地实现产品信息的共享与重用,一直是需要重点
本文探讨了中医关于儿童心理保健的论述,包括儿童的心理养护、家庭环境的影响、"三有余四不足"之说等。进而讨论了中医关于儿童心理保健的论述对于当今儿童心理保健的启示。
信用问题是目前各行各业的热点话题,讲诚实、守信用是文明社会的重要标志,是整个社会赖以生存和发展的基础。企业信用扫社会信用的建设为档案事业的发展提供了难得的发展机遇,如
我国茶文化在发展过程中融合了许多优秀的思想和理念,而加强茶文化在高校思政教育中的应用,能够有效地提升教学质量,为此本文从茶文化对提升高校思政教育质量的应用进行了分
本文首先分析了高职环境监测专业实验课教学改革与创新的必要性,其次总结了高职环境监测专业实验课教学改革需要面对的问题,最后本文系统研究了高职环境监测专业实验课教学改
学术生态系统构建在高校发展过程中发挥着十分重要的作用,其直接关系到高校的持续性发展水平。高校学术生态系统构建不仅受到学术主体、课程、研究课题以及学科设置等因素的影
目的探讨利凡诺羊膜腔注射、予米非司酮联合米索前列醇及水囊引产三种引产方式对胎盘、蜕膜组织形态学及炎症指标的影响。方法选取自2016年1月至2017年7月西南医科大学附属中