【摘 要】
:
数据库技术及其相关技术的发展趋于成熟,在各个行业都得到普遍使用,使得数据库中累积了大量的数字化资源。我们迫切需要把数字化的资源转化为知识,让知识参与到生活的决策中
论文部分内容阅读
数据库技术及其相关技术的发展趋于成熟,在各个行业都得到普遍使用,使得数据库中累积了大量的数字化资源。我们迫切需要把数字化的资源转化为知识,让知识参与到生活的决策中。目前,序列模式挖掘异常火热,理论研究成果颇丰,涌现出多种经典的序列模式挖掘算法,在实际应用中也取得了突破性的进展。在序列模式挖掘研究的初期,我们没有把每个项目的重要程度考虑在内。把所有的项目看的同等重要,不能保证在数据集中获取到的序列模式是用户最感兴趣的。本文提出了一种新的加权赋值方法,将权值的范围进行了合理的限定。序列模式挖掘存在一定的局限性,有价值的信息也可能存在于已发生的事件和没有发生的事件之间,因此负序列模式挖掘应运而生。负序列模式挖掘需要更多的存储空间以及消耗更多的时间。本文通过几种常见的序列模式挖掘算法,详细概括了它们之间的相同之处和不同之处,重点剖析了它们的剪枝过程使用的不同策略和方法,并且使用实验对它们进行了验证。本文在加权负序列模式挖掘算法WNGSP中引入了最小支持数和k-加权支持期望的剪枝策略。本文所使用的数据集由IBM数据生成器生成和UCI官方网站免费提供,使用了改进后的k-WNGSP算法和WNGSP算法进行了实验对比,结果发现它们在运行时间和获取到的加权负序列数目上存在差异。在其它的条件保持不变的情况下,k-WNGSP算法可以挖掘出更多的加权负序列模式,消耗更少的时间。本文通过三个实验证明了该算法的有效性,取得了较为理想的实验结果。
其他文献
访问控制理论一直是信息安全领域的研究重点。访问控制能够有效地保证资源被合法地访问,防止非法使用。目前,网络环境不断发展,接入的对象更加多元化,特别是对于那些有WEB门
基于广义估计方程样本量的计算在各个领域的应用已经非常广泛,也引起了各届研究学者的高度关注。对于基于广义估计方程样本量计算的数据,我们研究响应变量集群内的各数据间具有相关性的纵向数据。本文对基于广义估计方程推导出的样本量的计算公式,探索在不同数据结构和工作相关结构下对样本量的拟合效果的影响,进行数值模拟分析。最后结合实际的数据进行分析。本文的研究工作主要包括:(1)开始先介绍了本文的选题背景和意义,
现实世界中数据具有不完整,不一致等特点,为了提高数据挖掘的质量产生了数据预处理技术。本文介绍了粗糙集的理论知识,并在此基础上,主要做了以下两个方面的研究:1、在传统基
自动驾驶技术近年来呈现飞速发展的趋势,相关的技术日渐成熟,地图生成和导航避障也是其中热门的两个研究方向。但以深度学习为代表的研究技术存在的巨大数据量和运算量等问题,使其对硬件平台的要求极高。地图生成的准确性以及导航避障的实时性也需要大量数据和良好的硬件设备的支持。因此,本文主要研究基于低成本与低算力自动驾驶平台上的地图生成与导航避障算法。本文首先分析了目前地图生成领域中常用的GMapping、He
现代企业信息化程度加深,业务流程管理逐步被引入企业的管理与运营,跨企业的业务流程管理系统间的业务流程协作有很高的实用价值。本文以事件驱动多流程协同交互为研究对象,
图像处理技术作为计算机学科的一项重要的课题。图像处理技术已广泛应用到遥感技术、医学研究、图像的3D重构等研究中。图像处理技术的主要原理是把图像转化为数字矩阵,使用
给定拥有不同技能的专家集合、专家合作社交网络以及一项任务,社交网络中团队形成问题的研究目的在于形成一个能够完成该任务的团队,该团队必须满足任务的技能需求并且成员能
最近偏移正交幅度调制的滤波器组多载波系统(FBMC/OQAM)引起广泛的关注。峰均值功率比(PAPR)是多载波通信系统中一个比较常见的问题。由于FBMC/OQAM信号的叠加性,实部信号与
自动驾驶汽车由于不存在人为驾驶的随机性,操控精确性高,组成的交通流通行能力大,因此众多研究认为自动驾驶汽车将会逐步取代人工驾驶汽车,并从根本上缓解城市交通安全、交通拥堵、交通污染等社会顽疾。然而如何对整个系统内的共享自动驾驶汽车进行合理调度是急需攻克的难点,合理的调度方法能够提高系统整体收益、降低服务时间、降低乘客的出行费用,从而更好的为乘客服务。为此,本文以现有自动驾驶汽车技术为基础结合共享理论
进化算法是一类模仿生物自然选择与自然进化的随机搜索算法,因其具用很强的全局优化能力而得到了广泛地应用。近年来,利用进化算法求解多目标优化问题成为进化领域的一个研究