基于形态特征的时间序列相似性搜索研究

来源 :兰州理工大学 | 被引量 : 1次 | 上传用户:lincystar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,我们生活在一个复杂多变的数据时代,这些数据正源源不断地产生于各个领域,并潜移默化的改变着我们的生活节奏和生活方式。在这些数据中,能够给人们的生活带来巨大影响的时间序列是一类重要的数据,所以对其的分析变得十分重要。但由于高维和杂乱等因素的影响使得对时间序列的研究变得十分困难,为了找出序列中隐含的重要信息,研究人员开始运用数据挖掘的手段对时间序列进行探索研究。在时间序列数据挖掘算法中,时间序列相似性搜索占有重要地位,吸引了大多数学者的深入研究。随着时间的推移,时间序列相似性搜索研究的方法和成果普遍应用于人们日常生活中的各个领域,譬如:证券的投资与决策、地震勘探与预测、医疗保险等。在时间序列相似性搜索中,形态特征反映时间序列的主要特性,既能客观的反映出序列的全部变化趋势,又可以体现出细节变化特点。同时,基于形态特征的距离度量算法能够很好地计算出序列间的形态差别,对时间序列相似性搜索技术的研究具有深远影响。经过阅读和专研大量海内外关于时间序列形态特征范畴内的相关文献,本文全面细致地概况了基于形态特征的时间序列相似性搜索算法的近况,并对其发展阶段中的各个经典算法进行了详细的描述和分析,指出所存在问题,在此基础上提出了相应的解决方法,本文主要研究工作包括:(1)将算术编码技术应用到时间序列相似性搜索中,此方法首先运用关键点分段技术提取时间序列的均值和斜率等序列的特征信息,采取数字符号化方法得到能充分体现序列均值和斜率信息的符号序列;然后通过编码技术将符号序列转化为编码序列,实现时间序列在概率区间上的模式表示;最后采用分层欧式距离算法进行相似性搜索,由粗到细进行筛选,从而达到序列整体趋势匹配以及细节拟合的目标。(2)提出基于符号聚合近似(Symbolic Aggregate approximation,SAX)和角点弯曲值的复合搜索算法。该方法将时间序列进行角点分段并提取序列的角点弯曲度值和均值信息,利用二者组成二元组的形式对时间序列进行复合表示;在此基础上,采用具有较高质量的复合距离算法在时间序列集中进行相似性搜索,得到的结果集可以达到数值和形态两方面都相似的目的。
其他文献
近年来,由于P2P技术可以解决流媒体传输中的服务器瓶颈问题,极大提高传输能力,从而在新媒体业务中得到了广泛应用,成为流媒体传输的关键技术之一。如何能够在充分利用P2P网络
论文对当前主要几种主流的报表技术进行分析,指出了其中的不足之处。针对实际项目中Web报表关键的几个问题:建模方式、页面间的传值、打印时的内容隐藏、页面设计和实现中的
当前,随着处理器计算能力不断提升,密钥变的越来越不安全,单纯的加密已不能满足保护数据安全性的需要,信息隐藏技术成为了很多研究者关注和研究的热点。本论文的主要研究成果
对等网络技术(Peer-to-Peer,简称P2P)的迅速发展,使得其应用已经占据了互联网业务总量的60%-80%,甚至引起了网络拥塞,严重影响了其他正常网络业务的开展,因此就需要对P2P流量
家庭智能空间中,具备计算能力、感知能力、执行能力的各类智能设备被安装在家居空间内的多个位置,使普通的家庭物理空间变成一个可以应用知识表达和规则推理的智能空间,该空
随着数据的整合,从2000年开始,基于网络的运维管理系统开始进入了人们的视线。发展至今,运维管理系统已经不再是一个陌生的话题。一直以来,石化企业在不断加快自己信息化建设
第三次全国基础教育工作会议提出“要探索建立现代中小学管理制度,建立政府为主,社会各界共同参与的学校发展、管理与监督机制,鼓励社区、家长参与学校管理,形成社区积极支持
音频、视频业务正成为Internet中的重要网络应用,但传统的单播模式中服务器很容易成为系统瓶颈。内容分发网络CDN和对等网络P2P技术是当前因特网提供音视频服务的两种主流技
虚拟实验室是现代教学系统中一种重要的实验教学资源,能够为学生提供一种不受时间、地点和实验设备限制的实验环境,对促进教学改革和提高教学质量具有重要意义。本文在分析和
手势识别,作为人机交互领域中一种重要的方式,在人机交互中发挥了至关重要的作用。作为手势识别的初始阶段,手势分割所得到的分割结果将直接影响后续手势识别工作的进行。因