多变量时间序列的特征表示与属性选择算法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:jnyinli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是指按时间排序的一组观察值集合,并广泛应用于金融、医疗等众多领域,同时时间序列也存在维数高、规模大、结构复杂和噪声干扰等缺点,为了降低数据处理的复杂度,提高时间序列数据挖掘的准确度,本文在相关文献基础上,针对多变量时间序列在特征表示和特征选择(即属性选择)中存在的一些不足,提出了一些改进方法,本文的主要工作如下:(1)针对MCPCA的多变量时间序列特征表示算法的缺陷做出了改进,在介绍改进算法前,介绍了 CPCA算法和MCPCA算法在多变量时间序列中的使用原理和基本思想,并对算法步骤做了详细介绍,接着指出MCPCA中存在的问题,即所有子模块权重一致,提出基于类可分离性加权的MTS特征表示算法。为了突出不同子模块的权重,提高分类准确率,将类可分离性用于多变量时间序列的子模块加权中,通过最大化类间离散程度和类内离散程度比值给不同子模块赋予权重,加权后的子模块更能突出局部信息,提高局部信息对分类贡献。(2)针对现有的多变量时间序列属性选择算法准确率不高、时间复杂度高的情况,提出一种基于相关性密度的多变量时间序列属性选择方法ACDR,首次将快速聚类算法应用于多变量时间序列的属性选择中,将属性选择过程看成是聚类过程,选取各类的中心样本点作为代表属性。同时,为了解决多变量时间序列不等长和计算复杂度高的问题,介绍了相关性度量方法,并使用相关性矩阵代替原多变量时间序列矩阵。最后在根据ACDR算法绘制的属性参考指数排序图中,定义图中拐点为属性参考指数二阶变化率最大的点,并将拐点之前的属性选为特征属性,构成属性子集,实验结果验证了本文算法的是一种有效的MTS属性选择算法。
其他文献
氢气燃烧只产生水,不产生硫化物及碳氢化合物,因此氢气被称为零碳燃料。工业上,甲烷重整制氢是采用较多的制氢方法,主要包括甲烷蒸汽重整制氢(Steam Methane Reforming,SMR)
分布式能源的接入使得微电网摆脱了对传统能源的依赖,除了可以为微电网提供绿色和清洁的能源外,还可以有效减少输配电的网络损耗,并减少客户化石燃料价格波动的影响。研究表
含电力电子变压器的直流配电网是当前的研究热点,直流配电线路的故障测距技术是快速定位故障点,尽快恢复供电的重要技术支撑。提出了两种适用于含电力电子变压器的直流配电网
国际海事组织宣布2020年新规定:要求世界范围内的船舶燃油含硫量从3.5%降低到0.5%,新的规定将暗示着世界范围内航行的船舶应采用符合要求的低硫燃油、液化天然气、液化石油气等气体燃料。急需开发未来新型的船舶节能减排装置,应用到船舶和汽车等载运工具运用工程领域。锂离子电池作为新一代储能装置,在小型电器得到广泛的应用,但是为满足载运工具动力电源要求,对锂离子电池的能量密度和功率密度都提出了更高的期许
当前镁合金在航天、汽车和电子产品上的应用越来越广,但是高温性能不佳长期制约着镁合金的扩大应用。常见耐热镁合金体系适用温度基本在200℃以下。若想将镁合金应用于飞机和
石墨烯是由单层C原子组成的二维晶体,完美石墨烯具备优秀的电学、光学、热学和力学性能,但普通工厂中很难获得无缺陷的石墨烯,而缺陷会导致石墨烯各方面性能的降低,所以缺陷
金属/高分子复合结构能够发挥金属与热塑性高分子各自的优势,越来越多应用于轻型结构的搭建中。而这种复合结构的制备需要表面预处理、金属/高分子连接、过程仿真等多项步骤
论文依托郑州综合交通枢纽地下交通工程(东广场)项目,采用有限元数值模拟并结合现场监测,对地表上方弃土移除和基坑施工时既有区间地铁隧道隆起变形和水平收敛变形进行研究。通过在均布荷载作用下隧道轴线处的附加应力公式中引入Winkler地基模型,计算隧道最大沉降量;并进行了现场注浆试验,优化注浆方案。论文主要工作及取得的研究成果如下:(1)针对既有区间地铁隧道地表上方堆积有大量弃土的情况,通过研读文献资料
近年来,在我国航空业飞速发展的背景下,不仅是民用航空得到了高速发展,我国的通用航空更是发展迅速。针对现阶段我国通用航空研究较少的现状,对通用教练机的燃油消耗进行了研
金井河属于捞刀河支流之一,是长沙县北部联合水厂的取水水源,同时位于长沙县星沙水源地上游。金井河流域农业发达,流域内化肥的施用是造成流域面源污染的主要原因,流域面源污染对水源水质威胁巨大。因此,本文基于SWAT模型方法对金井河流域面源污染开展模拟研究,为星沙水厂水质管理提供技术支撑,对流域饮用水源地水资源保护工作具有重要意义。本文通过收集数据,进行土地利用分析,构建空间、属性及农业管理数据库,建立金