基于分布式概念格的序列模式发现研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:liongliong543
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识发现和数据挖掘是人工智能、机器学习、数据库和统计理论等相结合而形成的新的研究与应用领域,序列模式发现是数据挖掘的一个重要分支,具有广阔的应用前景。随着信息技术日新月异的发展和应用,从更大规模数据中高效地提取序列模式已经成为一挑战。本文将具有坚实的理论基础、完备的结构以及并行性特征的概念格模型引入到序列模式挖掘中,以实现当前大规模分布式数据的序列模式挖掘。主要工作如下:(1)概述了知识发现和数据挖掘的研究动态,相关的数据挖掘技术及应用,以及几种典型模式发现问题。(2)分析了AprioriAll算法、GSP算法和PrefixSpan算法等几种经典序列模式挖掘算法,并做了必要的比较。介绍了概念格的模型以及基于概念格的序列模式的数据挖掘研究成果和性能。(3)针对当前的数据库的大规模现象,基于子全概念的概念格构造算法SEA,提出一种新的基于分布式概念格的序列模式挖掘算法,以实现大规模数据的频繁序列模式挖掘。(4)针对序列模式的可信度的评价展开研究,提出了挖掘满足支持度条件的有高可信度的序列模式的算法。研究了先清理(取高可信度)数据库再挖掘满足高支持度的序列模式,以及先挖掘满足高支持度的序列模式,再清理两种不同方式,结果表明第一种方式效率高。
其他文献
保险经纪公司在我国的发展十分迅速,但各家保险经纪公司面临的问题却越来越多。保险经纪公司作为一种服务性的行业。保险经纪公司的经纪人,主要靠卖出保单,提取佣金。而保险经纪
随着信息时代科学技术的不断发展,对高性能计算提出了更高的挑战,如超级计算能力、海量数据、计算周期长等。网格计算技术的出现和发展为解决这些科学工程计算问题提供了途径
网络模拟,尤其是大规模的网络模拟通常都需要巨大的计算资源。当前普通的单机模拟器由于计算能力的限制,往往网络模拟的规模不能够满足实际的研究需要。因此,当前大规模的网
多媒体通信的迅猛发展对视频处理与传输提出了越来越高的要求。以交互式实时视频通信为代表的视频业务,由于其高带宽、低延时、低误码等要求使得视频业务成为整个多媒体通信
对人体生物医学信号进行采集和处理的便携式设备广泛地涌现在家庭保健和医疗领域。这种设备不仅可以对人体的健康状况做出初步判断,而且还可以作为医院临床辅助治疗装置。本文研究和设计的医疗保健设备对关系人体健康状况比较重要的血糖、血压和心电信号,采用不同于单次或简单多次的测量方式,运用动态长时间的检测方法,力求准确实时完整地反映出有关身体健康的生理参数。该设备设计的主要内容是对生物医学信号的数字处理。由于生
随着城镇化建设的不断发展,汽车已经得到普及,人们也越来越重视除基本生活外的精神建设。然而由于机动车的数量急剧增加、出行人数日渐增多,使得交通变得日加拥挤,引发了更多的交
随着市场竞争的日益激烈,各行业务需求的频繁变化,作为企业管理信息化、过程自动化的一项关键技术--工作流技术,其可靠性、完善性、可塑性、适应性研究成为当今研究热点之一。具
生物特征作为人类个体的内在属性,具有很强的个体独立性和区别差异性。因此,如何有效地将个人的生物特征应用于计算机智能信息处理应用领域吸引了广大研究学者们的浓厚兴趣,从而
SIFT特征匹配算法通过侦测与描述影像中的局部特征,所提取的特征点描述子对图像的旋转和尺度变换具有不变性,因此在图像处理领域应用广泛,但该算法也存在一些缺点。首先,SIFT
数学计算是新时代科学技术进步的重要标志之一。特别是随着计算机的问世,利用计算机进行高效地数学计算,在各个领域有着举足轻重的地位。 从数学计算分类来讲,一般分为符号计