多变量时间序列的预处理和聚类研究

被引量 : 8次 | 上传用户:woshi254211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多变量时间序列是时间序列的一个重要部分,而大部分有关于时间序列数据挖掘的研究都是面对单变量时间序列。多变量时间序列不仅描述了各个变量的变化规律,而且还揭示了各变量间的相互依存关系,因此,那些处理单变量时间序列的方法和技术无法照搬到多变量时间序列的研究中去。本文围绕多变量时间序列的预处理与聚类这两个主题,进行了研究现状分析,并提出了具有针对性的改进方法。预处理是多变量时间序列数据挖掘的重要课题,而插值是预处理的一种重要技术。本文将保形三次样条插值引进时间序列的插值,提出了双重插值模型。此模型两次使用保形三次Hermite插值技术对时间序列进行插值,继承了保形三次Hermite插值的优点,不需要序列上各点的导数信息便可以形成序列轨迹,容易将模型推广到高维空间,弥补了数据库中数据点太稀疏的缺陷。以移动对象时间序列为例,双重插值模型取得较好的实验效果,插值精度比分段线性插值、非结点样条插值和保形三次Hermite插值更高。多变量时间序列的变量属性可能是混合属性,即,包括数值属性和分类属性等。针对混合属性的多变量时间序列,首先基于奇异值分解提出了一种加权矩阵覆盖的方法,直观地判断对象间的邻居关系;然后以对象间的共同邻居数量作为多变量时间序列相似性的新度量标准,共同邻居越多越相似;最后提出了改进的层次聚类算法对多变量时间序列进行聚类,每一层上同时合并满足条件的若干对节点,这样减少了噪音对聚类过程的干扰,具有较好的鲁棒性;实验结果表明,这种方法在混合多变量时间序列的数据集上具有良好的效果,此外,在数值多变量时间序列的数据上,实验效果比基于动态时间弯曲距离(DTW)的标准层次聚类算法更好。多变量时间序列数据预处理是聚类研究的前提,数据插值可以填补空缺值、增加点密度和平衡序列刻度等,从而提高聚类分析的准确率。在移动对象和机器人仿真领域的实验结果表明,本研究具有较高的实际应用价值和良好的应用前景。
其他文献
研究与分析冠心病心绞痛病人应用中西医结合方案治疗的优越性。选取我院收治的冠心病心绞痛病人100例为对象进行研究,利用计算机将其随机分组为对照组与观察组,各50例。对照组
<正>"喜欢诗歌的孩子,长大了一定会有出息!"这是茅盾文学奖获奖小说《天行者》里,一位乡村小学校长说的话。长篇小说《天行者》是湖北著名作家刘醒龙的作品。19年前,在文坛上
期刊
蒋祖馨是我国近现代音乐史上一位非常杰出、享有重要地位的作曲家,音乐教育家。他创作了大量优秀的作品,他的钢琴作品虽然不如朱践耳、王建中、谭盾等人的作品流传广泛、众所
埃利达尔&#183;梁赞诺夫是前苏联杰出的悲喜剧导演,在二十世纪七八十年代前苏联女权运动的大背景下,梁赞诺夫通过自己的视角,用喜剧表达了自己对女性的认可、男女平等的观念
目的:评价改进额肌筋膜瓣悬吊术治疗先天性重度上睑下垂术式的可行性及其效果。方法:20例先天性重度上睑下垂患者,采用美容的重睑切口入路,将额肌瓣向下拉至睑板上1/3部位,缝
改革开放30年来,我国民营经济从无到有、从小到大,是中国经济最具活力的增长极,发展十分迅速,成为了中国国民经济的基础和社会主义市场经济的重要组成部分,撑起了国民经济的
北宋与南唐间的皖口之战,不仅决定了南唐政权最终覆灭的命运,也是一次以火箭、猛火油机等当时最新式武器相对抗为突出特色的典型战例。宋军能够夺得战役的胜利,与宋太祖重视
开放是当代中国的最鲜明特色之一。随着全球化进程的扩展和深入,国内国际两个大局的互动更为密切频繁,国内治理与全球治理成为这种互动关系的重要内容。中国要推进国家治理体系
用毛细管气相色谱法分离七里香蔷薇花精油中的各种组份,用GC/MS和Kvoats指数对各种组份进行鉴定,共定性出31种化合物,其中以正二十一烷、正十九烷、十九烯-1、正二十三烷为主
近年来,超市在我国得到了飞速发展,已经逐渐成为人们的主要购物场所。而超市的购物环境是其吸引顾客的重要筹码,为此,各大中型超市都安装了空调系统。然而超市中央空调却存在