【摘 要】
:
时间序列是指按照时间顺序排列的一系列观测值,具有数据规模庞大,高维度和数据实时更新的特点,时间序列广泛存在于现实生活中的各个领域。时间序列中隐藏的规律往往能够为事
论文部分内容阅读
时间序列是指按照时间顺序排列的一系列观测值,具有数据规模庞大,高维度和数据实时更新的特点,时间序列广泛存在于现实生活中的各个领域。时间序列中隐藏的规律往往能够为事物的发展提供重要的信息。随着时间序列在多个领域的出现,对时间序列的分析也越来越成为人们研究的热点。时间序列相似性连接是时间序列分析的基本操作,其主要的目的是找到两个时间序列中相似的子序列。时间序列相似性连接目前主要面临的问题有三个方面。首先是原始数据的预处理操作;其次是相似性度量函数的选取;最后是如何对于规模庞大的时间序列进行高效且准确的分析与挖掘。本文围绕这三个方面对时间序列的相似性连接进行深入研究,并在分布式平台上实现了高效的相似性连接算法。首先针对原始数据的预处理操作,本文选取的方式是Z-Normalization标准化对原始时间序列进行预处理。对于相似性度量函数,皮尔逊相关系数因其只进行一次线性扫描和保证数据的偏移和缩放不发生变化的优势常被用作于相似性度量函数,使用Pearson相关系数来衡量两个时间序列之间的相似性可以提供很重要的信息。在大数据时代,为了提高大规模时间序列数据分析的效率,分布式平台为时间序列的挖掘与分析提供了强大的计算能力。基于上述问题,本文提出了一种并行的时间序列相似性连接算法,并在不同的并行环境中对该时间序列进行相似性连接算法进行实现,主要的贡献如下。1.为了提高时间序列之间相关系数的计算效率,提出了并行化的FFT算法。2.在Spark平台上实现了时间序列相似性连接算法。为了适应分布式计算平台的特点,提出了一种时间序列划分的办法;为了提高扫描点积矩阵的效率,提出了一种点积矩阵划分的办法。并在真实的数据集上进行了充分的实验,对实验结果进行分析与评估。实验结果证明了我们的算法的高效性以及在不同数据集上的可扩展性。3.将时间序列相似性连接算法扩展到Map Reduce平台上,并在不同的数据集上进行实验验证,实验结果验证了算法在Map Reduce平台上的效率和性能。4.将本文提出了连接算法应用于时间序列的频繁模式挖掘,并给出部分匹配结果证实本文算法应用在频繁模式挖掘上的有效性。
其他文献
随着全球性的能源危机和环境污染问题的日益严峻,新型可持续能源的发展取得了令人瞩目的成就和经济效益。随着新能源研究在全球范围的推广,许多高等院校和科研院所对怎样提高直流变换器的电压增益和效率进行了大量的研究,而非隔离高增益DC/DC变换器一直是研究的热点之一。本文介绍了传统DC-DC变换器的发展现状,对提高电压增益的几种方式进行了总结。通过对文献的研究,本文首先将有源开关电感和后级倍压单元组合,并将
高等教育水平居世界之首的美国哈佛大学,除了教学和科研成果斐然,其道德教育成就同样首屈一指。“未有美国,先有哈佛”,作为美国本土历史最悠久的高等学府,哈佛大学见证并引领着美国道德教育的变迁。19世纪中期,美国道德教育开始衰落,20世纪70年代初,德里克·博克被任命为哈佛校长,成为重振美国大学道德教育的旗手和发起人之一。任职哈佛大学20多年的时间里,博克锐意改革、探索实践、著书立说,形成了独特的高等教
Copula是连接多元变量的联合分布函数与其一元边缘分布的纽带,Copula理论提供了多种类型的Copula分布族,不同类型的Copula有着不同的概率分布特征,可以用来描述不同类型的数
在工业智能化进程中,工业物联网是连通物理和信息世界的重要环节,面对工业物联网中对大规模、低功耗设备的接入需求,IEEE发布了面向物联网信息传输的IEEE 802.11ah协议,支持工业物联网中大规模终端设备进行低功耗、远距离通信。为了保证密集网络下的传输性能,802.11ah在介质访问控制(Medium Access Control,MAC)层提出了限制接入窗口(Restricted Access
在移动互联网速发展的今天,Android操作系统已经是智能移动设备中的主流操作系统,而Android操作系统中出现的恶意应用软件也随之上升。恶意软件规模的逐渐扩大,使得恶意软件的恶意家族判别问成为了一个十分值得研究的问。本文围绕Android恶意软件家族判别问为中心,使用文件可视化处理的方法和图像分类域中常用的深度学习技术展开以下研究内容:(1)研究B2M灰度可视化、信息熵可视化和基于图片增强的伪
随着新一轮信息技术和制造业的深度融合,各国相继推出以“智能制造”为主题的国家发展战略,制造业正面临一次全球层面的产业结构调整。鉴于此,“中国制造2025”是顺应产业发
近年来,现代科技的高速发展对电子设备最高工作温度提出了更高的要求,高温微电子学也越来越受到重视。针对目前国内对高温体硅CMOS(Complementary Metal Oxide Semiconductor)低压差线性稳压器(Low-dropout Linear Regulator,LDO)研究很少的现状,本文从载流子浓度出发,研究了体硅CMOS元器件的迁移率、泄漏电流等主要参数的温度特性,在一款
MoS2具有很高的化学稳定性和优异的催化活性,而且具有成本低、产量大等特点,是一种很有潜力的析氢反应催化剂。然而,MoS2的催化效率很大程度上取决于反应位点(包括基面和边界)
能源和环境问题是全球重点关注的问题,发展绿色清洁的新能源迫在眉睫。氢气可以通过燃烧得到热能,同时也可作通过电化学反应转化为电能,是一种理想的洁净能源。电解水制氢效
现代社会当中,计算机技术飞速发展,尤其是互联网正在发挥着越来越重要的作用,各种信息都有暴露在网上的可能,因此,如何保证人们在使用计算机和上网过程中的信息安全则越来越