【摘 要】
:
时间序列相似性搜索是时间序列数据挖掘算法的核心子例程,时间序列相似性搜索的效率已经成为制约时间序列挖掘算法发展的瓶颈所在。时间序列表示和相似性度量是时间序列相似性
论文部分内容阅读
时间序列相似性搜索是时间序列数据挖掘算法的核心子例程,时间序列相似性搜索的效率已经成为制约时间序列挖掘算法发展的瓶颈所在。时间序列表示和相似性度量是时间序列相似性搜索的研究基础,对实现时间序列的相似性搜索任务具有至关重要的作用。动态时间弯曲作为一种相似性度量方法可以有效处理时间序列沿时间轴上的变形等问题,具有良好的鲁棒性。然而时间序列数据通常是连续增长的不间断数据流,直接进行相似性搜索工作会造成相当大的存储空间消耗,且可能影响算法的准确性和可靠性。因此需要对时间序列进行预处理,以简洁和抽象的形式表达出原有时间序列的主要性质,在经过处理后的序列集上进行相似性搜索,从而提高序列相似搜索的效率。本课题在分析国内外时间序列数据挖掘最新研究的基础上,从时间序列相似性搜索出发,研究了时间序列的分段线性表示和动态时间弯曲等问题,主要完成了以下工作:(1)分析时间序列相似性搜索的现状及相似性搜索技术,并深入研究了时间序列分段线性表示方法和动态时间弯曲距离度量方法。(2)提出并定义了转折点和转折点优先队列,在此基础上提出了基于斜率提取转折点的分段线性表示方法。该方法选取转折点优先队列中的点作为序列候选点,能够在压缩原始序列的同时提取序列的主要性质。实验表明,该方法在多个领域的数据集上取得了良好的拟合效果,且具有良好的稳定性。(3)剖析以动态时间弯曲为相似性度量的搜索算法,提出了基于级联下界的动态时间弯曲算法。该方法通过将多种下界函数结合,并改进LB_Keogh下界函数的计算方法,实现了更早的提前终止效果。实验表明,该方法在一定程度上提高了动态时间弯曲的运算性能。(4)将“基于斜率提取转折点的分段线性表示方法”和“基于级联下界的动态时间弯曲算法”相结合,提出了基于动态时间弯曲的时间序列相似性搜索算法,当压缩率及约束窗口选择合适时,可以明显提高相似性搜索的效率。
其他文献
与音乐治疗相结合的特殊音乐教育能给特殊儿童带来情绪、运动、认知、心理、社会行为等方面的改变和进步,这种音乐教育应以帮助儿童感知声音为突破口,在学校教育、家庭教育、
本文主要是通过认知科学的研究成果来分析简·奥斯汀的作品《爱玛》,分为三个部分:爱玛对其他人物的想象,爱玛与其他人物间的误解,以及优秀的阅读心灵者。阅读心灵是指主题理
[目的]探明不同耕作模式对以生土为构建材料的新增耕地的改良效应,为该类土地的高产高效利用提供科学依据。[方法]于2017年6—9月分别在免耕、深松、翻耕3种耕作处理模式下的玉米地开展定位监测试验,分析耕作模式对土壤紧实度、养分含量以及作物产量的影响。[结果] 0—20 cm土层紧实度在免耕模式下最低,分别较深松和翻耕低约37.49和38.48 kPa/cm~2,且各模式下0—20 cm土层均呈分层
受益人代理人制度是日本现行《信托法》中的一大亮点,受益人代理人制度符合民法中代理制度的基本法律特征,其适用于受益人现时存在且为多数的情形。受益人代理人由信托当事人
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
数字人文研究兴起的环境下,通过对图书馆参与数字人文研究的可行性分析,及竞争态势分析,提出图书馆的相关发展策略,以便图书馆多方位、多渠道、多角度、全面系统地参与数字人
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
自20世纪70年代始,国外学界开始推动生态语言学研究,然而较之其他语言学理论流派,该学科尚未在国内引起足够关注,原因之一是其跨学科性质凸显,研究视角和范式多样化。为推动
本文针对某公司某集装箱船的相关焊接参数,建立一个用于计算船舶焊接耗材和基本工时的船舶焊接物量信息系统。船舶建造过程中涉及海量的焊接数据,船舶焊接物量信息系统将以分段
膜乳化是可制备单分散乳液的独特技术。多孔膜作为膜乳化技术的一个核心部件,对膜乳化结果有着重要影响。其中膜孔大小、膜孔径分布、膜孔类型、膜孔隙率以及膜表面性质均是